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第 1 章 ”蒙特 卡 罗 检验 


1.1 参数 蒙特 卡 罗 检 验 


对 假设 检验 问题 ， 在 很 多 情况 下 ， 很 难得 到 统计 量 在 原 假设 下 的 精确 分 布 或 
者 极限 分 布 ， 无 法 确定 是 否 接受 原 假设 的 临界 值 点 ， 此 时 可 借助 蒙特 卡 罗 逼 近 的 
方法 . 蒙特 卡 罗 逼 近 是 一 种 容易 实施 的 方法 ， 很 多 文献 对 它 做 了 相关 的 研究 . 文献 
Bartlett(1963) 的 讨论 部 分 ,首次 描述 了 MCT 的 思想 ， Hope (1968) 证 明 在 参数 的 
情况 下 ， 如 果 没 有 讨厌 参数 ， 和 蒙特 卡 罗 检 验 可 能 达到 精确 的 显著 性 水 平 ， 即 使 与 一 
致 最 优势 (UMP) 检验 做 比较 , 它 的 功效 都 很 高 , 在 讨厌 参数 存在 的 情况 下 ，MCT 
也 同样 适用 ， 也 就 是 ， MCT 可 应 用 在 参数 情况 ， 在 空间 模式 研究 中 ， Besag 和 
Diggle (1977) 把 MCT 应 用 在 随机 变量 分 布 中 有 讨厌 参数 的 情况 . 如 果 模 拟 可 以 基 
于 原 假设 下 最 小 充分 统计 时 的 观测 值 实现 ， Engen 和 Lillegård (1997) 用 MCT if 
近 统 计 其 的 分 布 . 在 具有 讨厌 参数 的 某 些 特定 情况 下 ，MCT 仍然 可 能 达到 精确 的 
显著 性 水 平 ， Zhu ，Fang 和 Bhatti (1997) 构造 投影 追踪 类 型 的 Crimer-von Mises 
统计 其 检验 参数 族 的 分 布 。 Hall 和 Titterington (1989) 说 明 在 参数 族 的 情况 下 ， 
无 论 是 否 有 讨厌 参数 ， 以 及 统计 基 渐 近 分 布 是 否 枢 轴 ， 由 MCT 逼近 得 到 的 误差 要 
比 由 相应 统计 量 的 渐 近 分 布 带 来 的 误差 小 ; 而 且 MCT 可 以 区 分 以 n-1? 的 速度 到 
近 原 假设 的 备 择 假设 ， 这 些 结论 进一步 加 强 了 MCT 方法 的 理论 依据 . 

举 一 个 简单 的 例子 解释 如 何 用 MCT 方法 .考虑 具有 分 布 F(.) 的 独立 同 分 布 
Gid.) 随机 变 基 z1,… ,zn ， 假 设 要 检验 F(-) = G(-,9) 是 否 成 立 ， 其 中 9 是 未 知 
BM GO 为 已 知 函 数 ， 对 这 个 检验 问题 的 任何 检验 统计 量 ， 如 T(z1,… ,zn) ， 
MCT 方法 就 是 从 分 布 GO Â) 中 独立 产生 参考 数据 ol, ,z4 ， 计 算 相 应 统计 量 的 
值 T(z4,… ,z%) 作为 参考 值 ， 其 中 6 是 9 的 估计 . 如 果 T 的 值 较 大 ， 拒 绝 原 假 
Bs 对 双边 检验 的 情况 不 难 做 相应 调整 ， 记 了 T(z1,… ,zn) = To, Ti, Tm 表示 
由 蒙特 卡 罗 得 到 的 m 个 参考 值 ， p 值 的 估计 为 


p=k/(m+1), 


其 中 ， kÆ TT ,Tm 大 于 或 者 等 于 To 的 个 数 . 因此， 给 定 水 平 a ， 如 果 
万 < a ， 拒 绝 原 假设 . 

值得 指出 的 是 20 世纪 80 年 代 发 展 的 参数 自助 近似 的 具体 步骤 类 似 于 上 述 的 
MCT 步骤， 具体 可 参考 文献 Beran 和 Ducharme (1991). 
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12 非 参数 蒙特 卡 罗 检 验 


1.2.1 方法 论 的 动机 

对 于 半 参 数 或 非 参 数 的 情况 ， 在 原 假设 下 很 难 模拟 参考 数据 计算 统计 量 对 应 
MCT 的 条 件 统计 量 .主要 困难 在 于 即使 在 原 假设 下 ， 模 型 不 能 用 含有 几 个 未 知 参 
数 的 具体 模型 刻画 . 例如 ， 检 验 现 有 的 数据 分 布 是 否 为 椭 球 对 称 分 布 族 (简写 为 椭 
球 分 布 )， 如 果 对 任何 4 x d EXER H, PERREN 4 和 位 置 向 量 u, E 
HA(X — u) 和 4(X 一 及 的 分 布 相同 ， 称 4 维 随机 向 基 X 服从 椭 球 分 布 ， 如果 X 
BME DAR, 4 实际 上 就 等 于 OO? ， 具 体 细节 可 参考 文献 Fang ， Kotz 和 
Ng (1990). 从 这 个 定义 中 ， 我 们 不 难看 出 椭 球 分 布 不 是 参数 族 . 自助 法 是 统计 中 
非常 重要 的 方法 之 一 。 Efron (1979) 首次 提出 这 一 方法 ， 现 在 它 已 发 展 成 解决 上 
述 问题 的 普遍 适用 的 方法 之 一 。 Efron 自助 法 ， 也 称 为 传统 自助 法 ， 它 的 基本 思 
RUE: 从 现 有 数据 的 经 验 分 布 中 产生 参考 数据 . 关于 这 种 方法 的 研究 很 多 ， 可 参考 
Davison 和 Hinkley (1997). Shao 和 Tu (1995) 对 这 个 问题 也 做 了 全 面 的 研究 ， 然 
而 ,用 这 个 方法 时 必须 注意 几 个 问题 , 第 一 ,很 难 研究 逼近 的 精确 性 或 者 渐 近 精确 
th, 关于 它 的 研究 仍然 停留 在 具体 的 某 些 问题 中 ,并 没有 形成 统一 的 方法 ， 且 相关 
的 文献 并 不 多 ， 其 中 可 参考 文献 Singh (1981). 在 一 维 变量 的 情况 ， Zhu 和 Fang 
(1994) 得 到 对 应 Kolmogorov 统计 基 的 自助 统计 基 的 精确 分 布 ， 且 证 明 它 是 Vn 相 
合 的 ， 就 我 们 的 知识 而 言 ， 这 是 一 篇 唯一 研究 自助 统计 量 准确 分 布 的 文章 ;第 二 ， 
因为 参考 数据 是 从 经 验 分 布 中 产生 , 且 经 验 分 布 收 敛 于 数据 的 分 布 ， 自 助 逼近 不 能 
使 统计 基本 身 有 效 ， 可 能 浙 近 有 效 ; 第 三 ， 自 助 逼 近 有 时 不 相合 ， 对 于 这 种 不 相合 
的 修正 也 没有 统一 的 方法 .从 n 个 数据 中 产生 m 个 数据 是 修正 不 相合 的 方法 ， 但 
是 在 很 多 情况 下 ,这 种 方法 功效 不 好 . 在 回归 分 析 中 ， Wu (1986) 提出 减少 方差 估 
计 偏 差 的 新 方法 ， Mammen (1992) 很 好 地 发 展 了 这 种 方法 ， 并 称 之 为 Wild 自助 
法 ， 是 一 种 重要 的 逼近 方法 . Wild 自助 法 已 经 成 功 地 应 用 在 许多 不 同 的 领域 ， 特 
别 是 回归 模型 的 检验 , 见 Hirdle 和 Mammen (1993), Stute, González Manteiga 和 
Presedo Quindimil (1998). 在 某 些 情况 下 ， 这 种 方法 可 以 克服 Efron Heg H BE 
近 法 造成 的 不 相合 性 ， 然 而 ， 并 不 是 在 所 有 情况 下 它 都 是 相合 的 . 第 4 章 对 回归 函 
数 研究 降 维 类 型 的 检验 中 ,给 出 一 个 例子 说 明 Wild 自助 法 的 不 相合 性 . 在 第 6 章 
检验 异 方差 性 的 问题 中 ,也 给 出 类 似 的 例子 ， 第 四 ， 在 假设 检验 问题 中 , 需 慎 重 处 
理 自助 法 产生 的 参考 数据 ， 否 则 可 能 降低 检验 的 功效 . 

置换 检验 是 另 一 种 产生 参考 数据 的 方法 ， 见 文献 Good (2000)， 在 有 些 情况 
下 ， 它 非常 有 效 ， 然 而， 如 果 只 有 一 个 数据 ， 不 能 通过 置换 方法 得 到 参考 数据 ,在 
这 种 情况 下 这 种 方法 的 应 用 受到 限制 ， 且 方法 的 实施 也 要 花 大 量 的 计算 时 间 . 

自助 法 完全 是 非 参数 的 统计 方法 论 ， 它 对 模型 结构 以 及 数据 分 布 的 限制 条 件 
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很 少 . 因此， 如 果 模 型 并 不 是 非 参 数 的 ， 而 是 半 参 数 结构 ， 如 椭 球 对 称 分 布 ， 我们 
可 以 用 其 他 的 蒙特 卡 罗 逼 近 ， 充分 利用 数据 所 提供 的 信息 . 基于 这 些 观 测 数据 ,我 
们 提出 了 非 参数 蒙特 卡 罗 检验 (NMCT). 在 第 2 章 用 NMCT 方法 检验 四 种 类 型 的 
分 布 , 并 且说 明 此 方法 对 这 些 类 型 的 检验 精确 有 效 . 如 果 第 2 章 所 研究 的 分 布 中 含 
有 讨厌 参数 ， 在 第 3 章 证 明 NMCT 方法 对 这 种 情况 渐 近 有 效 的 ， 而 且 VF 相合， 
然而 根据 自助 逼近 法 不 能 得 出 这 样 的 结论 第 4~6 章 研究 了 回归 模型 的 模型 检验 
问题 ， 第 4 章 和 第 6 章 也 说 明了 Wild 自助 法 在 某 些 情况 下 不 相合 .第 7~9 章 研 
究 了 一 些 用 自助 允 近 法 可 以 实现 ，NMCT 方法 也 很 容易 实现 的 问题 ， 而 且 功效 很 
好 . 在 下 面 的 两 个 小 节 ， 分 别 给 出 了 随机 变量 独立 可 分 解 时 ， 以 及 检验 统计 量 可 以 
渐 近 表示 为 线性 统计 基 的 函数 时 ， NMCT 的 具体 实现 过 程 . 


1.2.2 ”基于 可 独立 分 解 随 机 变量 的 NMCT 方法 


NMCT 最 初 的 动机 来 自 检验 几 类 重要 的 多 元 分 布 ， 现 在 已 经 发 展 成 一 般 的 方 
KE. 关于 检验 多 元 分 布 的 具体 细节 见 第 2 章 . 

我 们 经 常用 4 种 类 型 的 多 元 分 布 ， 椭 球 对 称 、 反 射 对 称 、 Liouville-Dirichlet 
和 对 称 刻度 混合 分 布 ， 关 于 这 4 种 类 型 分 布 的 定义 ， 可 参见 第 2 章 和 第 3 章 . 这 
些 分 布 族 分 别 是 正 态 、 对 称 、 Beta 和 平稳 分 布 的 推广 ， 见 文献 Fang, Kotz 和 Ng 
(1990) 以 及 此 文 的 参考 文献 . 

关于 椭 球 对 称 和 反射 对 称 分 布 的 检验 问题 已 经 有 一 些 研究 . 例如 , Aki(1993) , 
Baringhaus(1991), Beran(1979), Ghosh 和 Ruymgaart (1992), Heathcote, Rachev 和 
Cheng(1995). 由 于 这 些 分 布 族 ， 如 椭 球 对 称 分 布 ， 不 能 用 有 限 的 参数 完全 刻画 ， 因 
此 不 能 简单 的 用 第 1.1 节 中 所 提 到 的 关于 参数 的 MCT 双 近 统计 基 在 原 假设 下 的 分 
W. 在 假设 检验 问题 中 ,统计 基 在 原 假设 下 的 极限 分 布 通常 很 难 确定 临界 值 点 ， 可 
参见 Zhu, Fang, Bhatti 和 Bentler (1995). Diks 和 Tong (1999) 提出 了 条 件 蒙 特 
卡 罗 检 验 ， 其 中 的 思想 是 : 如 果 密 度 函数 在 等 距 紧 集 G 下 不 变 , G 轨道 集 是 最 
小 充分 统计 量 ， 在 给 定 G 轨道 观测 值 的 条 件 下 模拟 分 析 ， 他 们 对 不 含 讨厌 参数 的 
球 和 反射 对 称 的 多 元 分 布 做 检验 .Neuhaus 和 Zhu(1998), Zhu 和 Neuhaus (2003) 
也 对 这 两 种 类 型 的 多 元 对 称 分 布 构造 了 条 件 检验 过 程 . 

接 下 来 说 明 如 何 产生 参考 数据 ， 此 方法 依赖 于 分 布 的 可 独立 分 解 性 . 

定义 1.2.1 随机 向 量 X 称 为 独立 可 分 解 ， 如 果 X= 二 .2 依 分 布 成 立 这 
里 ， 和 了 独立， 了 .2 表示 和 PZR, URR: HRY p ZEAHHE, 
Y-Z= (YMZO),... Y9 Z9) ; 如 果 2 是 一 维 的 ， 了 .2 = (YD2,... ,YOZ) ; 
tR Y RH, Y-Z=(¥ZO,... yz). 

如 果 已 知 工 或 2 的 分 布 ， 上 面 的 可 分 解 性 是 MCT 步骤 可 实施 的 根据 记 
T1,… ,zn 表示 样本 n 的 iid. 随机 变量 ， 如 果 zi 在 原 假设 下 可 独立 分 解 为 ri = 
vizi, MURR THE T(E,- ,zn) ET Tn 21, Yn" 2n). NMCT 方法 为 : 给 
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定 ai ,zn ， M Y 的 分 布 中 独立 产生 一 组 参考 数据 of ,ys ， 则 可 得 相应 统计 
量 的 值 了 (yh ,… Yn n). 假设 如 果 T 值 较 大 ， 原 假设 被 拒绝 ， 对 双边 检验 问题 
不 难 做 相应 的 调整 ， 记 由 原始 数据 得 到 的 T 为 Ti ， 通 过 蒙特 卡 罗 产 生 m 组 参考 
数据 ， 相 应 的 得 到 m 个 值 ， 分 别 记 为 五，… ,Tm . 统计 其 了 的 p 值 的 估计 为 


p=k/(m+1), 


HH, kT TiTa 中 大 于 等 于 To OTR. REKT a, REP<a, 拒 
绝 原 假设 . 

由 于 T(za ,zn) 和 了 工 (他 Yn zn) 同 分 布 ， 而 且 给 定 2… ,zn ， 它 
们 有 相同 的 条 件 分 布 ， 检 验 的 可 能 精确 有 效 ， 下 面 的 命题 说 明 这 个 性 质 . 

命题 1.2.1 在 原 假设 下 , MEX 可 独立 分 解 为 了 .2 , 那么 , 对 任何 0< a <], 

z a(m+1 
Pri < a) < Lt, 

其 中 ， [d] 表示 c 的 整数 部 分 . 

证 在 原 假设 下 , 给 定 有 4,… ,zn ，7To, 了 1,… ,Tm 条 件 独立 同 分 布 , 如 果 T 





间 没 有 结 ， 广 在 {A EH 均匀 分 布 . 由 于 方 Sa BE k< amt), 
因此 
{a(m + 1)] 
Pr(p sal tl 


MIR T; ZA, El k< [a(m+1)]. HA To EDE T PH m+1—-[a(m+1)] 

个 大 的 元 素 大 ， 因 此 ， 
Pr(p < a| z1,*+- ,2n) < bmt D, 

对 2 RAR, 证 毕 . 

这 个 命题 说 明 在 变量 可 独立 分 解 时 ，NMCT 方法 可 以 精确 有 效 . 相 比较 而 言 ， 
自助 法 和 置换 检验 并 没有 这 个 优点 ， 在 第 2 章 对 上 述 所 提 到 的 四 种 类 型 的 分 布 用 
REEF RK. 
1.2.3 ”基于 随机 加 权 的 NMCT 方法 

如 果 假 定 的 数据 分 布 不 具有 独立 分 解 的 性 质 ， 本 节 建 议 用 随机 加 权 的 方法 产 
生 参 考 数据 ， 这 个 方法 可 实施 的 根据 是 经 验 过 程 理论 ; 随机 加 权 经 验 过 程 的 收敛 
性 . 

假定 z1,… ,zn 表示 ii.d. 的 样本 ,如 果 检 验 统计 量 , 如 Tr = T(z1,… ,zn) ， 

可 以 重新 写 为 了 o Rn . RH, THR, 的 函数 ， Rn 是 具有 下 述 形式 的 过 程 : 


12 
Rn = { 寺 站 ooe 


a 
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其 中 , TÆ SCRI, 如 果 5 为 单 点 ，Rn AME, E(I(X,t)) = 0. Tr(En) = 
T o Rn(En) 表示 对 应 于 Ta 的 条 件 表达 式 ， 用 这 个 条 件 表达 式 逼 近 T 的 分 布 ， 其 


中 ， 





Rn(En) = f eJ(a;,t), te s} : 
j=l 


En = {e1,… ,en} 为 独立 于 zj 的 随机 变量 . 如 果 e; 以 相同 的 概率 取 值 +1 ， 这 类 
随机 加 权 的 方法 称 为 随机 对 称 加 权 (Pollard, 1984) ; 如 果 e; 是 均值 0 , 方差 1 的 正 
态 分 布 ， 见 文献 Dudley (1978), Giné 和 Zinn (1984) ， 这 种 加 权 方 法 类 似 于 Wild 
自助 法 (Mammen, 1992). 假如 z1,… ,zn 为 可 交换 的 随机 变量 ， Van der Vaart 和 
Wellner (2000) 称 之 为 可 交换 自助 法 . 

然而 , 大 部 分 的 检验 统计 量 很 难 具有 这 样 的 表达 式 . TERA FE, Tr(a, 
In) 有 下 述 渐 近 表达 式 : 


Tn(zl ,Tn, Pa) = T © Rn + op(1), (1.2.1) 


其 中 ， Ry 的 表达 式 为 mn-12 È J(aj,,t), E(I(X,v,t)) =0， 少 是 感 兴趣 的 未 
È 


知 参数 ， 它 可 以 是 无 限 维 的 ， 如 未 知 的 光滑 函数 .以 下 给 出 估计 p 值 的 一 般 步 怠 : 
步骤 1 产生 均值 0 ， 方 差 1 的 独立 随机 变量 ej(j = 1,…,n) 记 En := 
(el,… ,en) 以 及 Rn 的 条 件 对 应 表达 式 


Rn(En,t) = BEnb), (1.22) 
jal 


其 中 ， 少 是 根据 数据 z1,… ,zn 得 到 乡 的 相合 估计 ， 对 应 的 条 件 检验 统计 量 为 
Tn(En) = T o Rn(En): (1.2.3) 


步骤 FE mA En, iw EA? (i =1,---,m), AB mA T,(En) 值 , 
分 别 记 为 (EP), i= 1… ,m. 

步骤 3 WRT, 的 值 较 大 ， 拒 绝 原 假设 .对 于 双边 检验 问题 ， 不 难 做 出 相应 
的 调整 ，p 值 的 估计 为 = 上/(m +1) , 其中， 上 表示 TME) 大 于 或 者 等 于 p 
的 个 数 ， 给 定 水 平 a, WR P <a, HAARR. 

命题 1.2.2 假定 ei Riid 且 具 有 紧 支 撑 的 变量 ， Rn RIA Ak EE tk e 
Gaussian 过 程 RR ， 且 存在 a > 0 HR -y= One). 进一步 假设 对 任何 国定 
tE 3 ， 函 数 ] 关于 少 的 两 阶 偏 导 数 存在 ， 且 所 有 的 偏 导数 关于 t 一 致 具有 有 限 
的 一 阶 和 矩 ， 则 对 于 几乎 所 有 序列 (Z1,… ,zn) ， Tn(En) 和 Ty 的 极限 相同 . 


6 第 1 章 ”蒙特 卡 罗 检 验 





证 根据 已 知 条 件 ， 可 得 


Ra(Enst) = Fe Lees Vt) + opt). (1.2.4) 
j=l 


也 即 是 ， Rn(En,*) 为 经 验 过程 , 根据 文章 Van der Vaart 和 Wellner (2000) 中 的 定 
理 3.6.13, Rn(En) 和 Rn 极限 相同 .根据 了 的 连续 性 ， 结 论 成 立 . 

注释 1.2.1 下 面 举例 说 明 检 验 统计 量 可 以 渐 近 地 表示 为 式 (1.2.1) 关于 线性 
统计 量 的 函数 .考虑 回归 模型 


Y =8(X)+e, 
HP, P(O) Athi, Y 为 1 维 响应 随机 变量 ， 克 Rhee 的 p 维 列 随 机 向 
量 ， 假 设 检验 的 问题 为 
Ho: 8)efm(,):gee}， 


HP, go 为 给 定 的 函数 ， 日 为 g 维 Euclidean 空间 R? 上 的 紧 集 ， 因 此 ， 在 原 假 
设 下 ， 存 在 列 向 量 bo 满足 O(-) = Pol, 0o). 通常 使 用 的 检验 方法 是 基于 残 差 构造 
RUE. 直观 上 说 ， 如 果 残 差 比 较 大 ， 则 检验 统计 量 的 值 可 能 较 大 ， 拒 绝 原 假设 ， 
假定 (21,41) , (En Yn) X iid. 样本 , 根据 注释 1.2.1 的 想法 ,构造 如 下 统计 量 ; 

得 分 类 型 的 检验 ”上 = y — 名 (zi, 名 )(j = 1,… , 表示 通过 拟 合 回归 函数 
$o(-,0o) 得 到 的 残 差 ， 其 中 名 为 go 的 相合 估计 ， 得 分 类 型 的 检验 定义 为 


2 
T= [ihres 


其 中 ，uw(.) 为 待 选择 的 权重 函数 . 记 R =n 三 solo 加 如 果 Ôo 根据 最 小 
- 


二 乘法 得 到 ， 不 难 证 明 在 原 假设 下 ， 假 定 某 些 正则 条 件 成 立 ， 名 ~ bo 的 渐 近 线性 
BARK o — bo =n X A(z, yj, ECB), 8o) + op(1/ VR) ， 


其 中 ， 
Ii (js Yj, E(B)’, 90) =: [E( Bh(X, 00)( Bo(X,00))"]! Gp (zi, Go)ey, 
H 器 为 Bo 关于 9 的 一 阶 导数 .显然 有 E(X, Y, E(%)?,00)) =0. 记 


I(23,4;, E(B0)’, E( Sw), 80) 
= ejw(zj, 80) — (Jı (zj, yj, E(®)”, 80)) E| Po(X, 40)w(X, 00)]. 
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简单 推导 可 得 Rolt) 的 渐 近 表达 式 为 


Ra(t) = 1/Vn > J (z3, yj, E( 25)", E(w), 80). 
jal 
A (1.2.1) 中 的 了 在 这 里 为 平方 函数 . 
Crimer-von Mises 类 型 和 Kolmogorov 类 型 的 检验 ” 记 R,(z) =n71/? 


Bu(zj,bo)T(zj < x) ,其 中 ,“X <2” RRX 的 每 个 分 基 小 于 或 等 于 对 应 于 = 的 分 
Ht. 由 上 述 关于 得 分 类 型 的 检验 可 知 , Ra 的 渐 近 表达 式 为 mw -12 È Jeeps E(%), 
= 


E(8gw), 0, w, x). Créimer—von Mises 类 型 的 检验 统计 量 为 Th = [[Rn(X)]?d F(X), 
Kolmogonov 类 型 的 检验 统计 量 为 sup,z |Rn(z)|. T 在 这 里 分 别 为 积分 和 上 确 
界 函数 . 

需要 指出 的 是 , 这 里 所 提出 的 算法 类 似 于 Wild 自助 法 (如 Hirdle 和 Mammen 
(1993) ， Stute, Gonzélez Manteiga 和 Presedo Quindimil (1998)). 算法 的 不 同 之 处 
TET: Wild 自助 法 是 产生 样本 (X7, Yr); 而 NMCT 方法 只 用 替换 Ra 中 的 ei 
可 以 证 明 ， 在 对 线性 模型 做 拟 合 优 度 检验 时 ， 也 就 是 说 ， Go(z, 00) = 65z ， 如 果 
采用 上 述 检验 法 ， Wild 自助 法 与 NMCT 等 价 . 但 是 对 其 他 的 模型 做 拟 合 优 度 检 
验 ， 这 个 等 价 性 未 必 成 立 . 第 4 章 给 出 更 详细 的 研究 . 对 于 更 一 般 的 模型 ， 如 果 用 
Crämer-von Mises 检验 做 统计 量 ， NMCT 和 Wild 自助 法 的 等 价 性 不 存在 ， 我 们 
将 在 第 5 章 做 讨论 . 


第 2 章 多 元 分 布 的 检验 


本 章 研究 多 元 分 布 的 检验 问题 . 虽然 在 多 元 分 析 中 , 对 多 元 正 态 分 布 的 检验 仍 
然 是 研究 的 问题 之 一 ,但 是 越 来 越 多 的 工作 开始 致力 于 非 参数 情形 的 研究 . 在 多 元 
分 布 中 ， 有 一 些 重要 的 分 布 族 . 本 章 考虑 四 类 不 同 的 分 布 族 的 检验 问题 ,本 章 的 内 
容 大 部 分 来 自 文献 Zhu 和 Neuhaus (2000). 

为 了 用 第 1 章 提 到 的 NMCT 方法 检验 多 元 分 布 族 ， 需 要 分 析 这 些 分 布 族 是 否 
具有 独立 可 分 解 性 . X 表示 d AUER, X=Y. Z 表示 X A Y- Z 的 分 布 相 
同 ， 只 研究 Y 和 2 是 否 独立 ， 且 Y 的 分 布 已 知 的 情况 . 


2.1 四 种 类 型 的 多 元 分 布 


情形 (a) 椭 球 对 称 分 布 

对 于 这 类 分 布 族 ， 玉 = U ||X|| 依 分 布 成 立 , 其 中 ，U 和 |XI 独立 , 且 U 是 
BR 54 = {a:llall = 1,a € RÌ} 上 的 均匀 分 布 ，|: | 表示 Re 上 的 Euclidean 范 数 . 
不 难看 出 Y =U , Z= |X|. 多 元 上 分 布 (Fang, Kotz 和 Ng, 1990, 例 2.5) 和 正 态 
分 布 N(0, 14) 属于 这 类 分 布 族 . 实际 上 我 们 取 U = X/||X). 

情形 (b) 反射 对 称 分 布 族 

对 于 这 类 分 布 族 , 依 分 布 有 X =-X. PROM X =e- X 成 立 , 其 中 e = +1 
的 概率 相同 ， X 独立 可 分 解 . 所 以 ，Y =e ， Z=X. [-c,cl4(c > 0) 上 的 均匀 分 
布 属于 这 类 分 布 族 , 

情形 (c)Liouville-Dirichlet 分 布 族 

对 于 这 类 分 类 族 , 依 分 布 有 X = Yor, 其 中 Y 是 独立 于 刻度 变量 > 的 Dirichlet 
分 布 Dla) , BR a = (a, aa) BA; Y 的 分 其 y™, yO 满足 Bt = 
(W0, yO) € Ri: yO 0, Sy = 1). 对 于 这 类 分 布 族 ，Y = x 2) 和 


Z= È a ， 其 中 X = (2),... 2). 这 类 分 布 族 包括 多 元 Beta 和 逆 Dirichlet 
分 布 (文献 Olkin, Rubin(1964); Guttman, Tiao(1965)). 

情形 (d) 对 称 刻度 混合 分 布 

关于 这 类 分 布 族 , 对 zx AO, 存在 刻度 函数 g(z) 满足 g(z) = g(-z) E g(x) £0. 
Zz/g(z) 与 g(z) MIL, H z/g(z) 为 空间 C4 = {y = (0 ,y) € RE: gly) = 1} 
上 的 均匀 分 布 ， 所 以 ， 可 以 取 Y = X/g(X o ) 以 及 2 = g(X). 这 类 分 布 族 较 大 ， 包 含 
所 有 的 球 对 称 分 布 ， 具 有 密度 函数 cexp( 一 x lz 中 |) 的 Laplace 分 布 也 属于 这 类 分 布 . 
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对 于 上 述 所 提 到 的 4 类 分 布 ， 分 别 从 S4 上 的 均匀 分 布 、 两 点 分 布 、 B4 上 的 
Dirichlet 分 布 ， 以 及 C4 上 的 均匀 分 布 产 生 数据 yi 

上 述 分 布 族 不 包含 讨厌 参数 ， 对 第 2.2 小 节 中 的 检验 问题 ， 考 虑 位 置 参数 为 讨 
厌 参数 的 分 布 . 用 /表示 分 布 X 的 位 置 ， 如 均值 或 者 中 位 数 . 

如 果 

X-p=Y-Z 

依 分 布 成 立 , 通常 2 ARRE X-u BPR, 如 hau) 考虑 与 上 述 情形 (a), 
(b) 和 (d) 相关 的 以 下 分 布 族 : 

情形 (al) 关于 u HERAT EG 


X -p =U |X — pleat AR; 
情形 (b1) 关于 反射 对 称 
X -p= -(X 一) 依 分 布 成 立 ; 


情形 (d1) 具有 未 知 参数 u 的 对 称 刻度 混合 , 其 中 ，(z 一 1)/g(z 一 4) 5 gle- u) 
独立 ， 且 为 空间 C4 = {y = (m, ,ya) € RY gly) = 1} 上 的 均匀 分 布 . 
对 于 这 三 类 情况 ，h(z — pw) HA e-ul, 2—p Al ga- y). 
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记 palt) = E{exp(it!X)} 为 多 元 分 布 X 的 特征 函数 . 如 果 依 分 布 有 X=Y-Z, 
此 时 pelt) = Ez{py(t2Z)} ， HF, py 为 了 的 特征 函数 ， 考 虑 积分 





Jle- Edora wa a, 


HF, Wal) 定义 在 积分 有 限 的 支 集 上 , 含有 参数 a 的 连续 的 权重 函数 . Henze 和 
Wagner (1997) 关于 多 元 正 态 的 拟 合 优 度 检 验 的 统计 量 ， 与 本 节 所 提出 的 统计 量 相 
关 . 在 原 假设 下 ， 积 分 等 于 零 . 在 备 择 假设 下 ， 积 分 的 值 在 一 定 程度 上 可 能 依赖 于 
具体 的 权重 函数 .如果 Wa(-) 等 于 正 态 密度 函数 ， 它 的 支 集 为 Re ， 积 分 大 于 零 ， 

如 果 支 集 是 R* 上 的 紧 子 集 ， 积 分 不 一 定 等 于 零 . 所以， 基于 上 述 积分 的 检验 不 一 
定 对 所 有 固定 备 择 假设 都 是 相合 的 . 但是， 下 面 通过 例子 说 明 这 个 问题 并 不 是 很 
严重 .假定 W 的 支 集 为 紧 集 且 含 有 原点 ， 特 征 函数 连续 是 分 布 X 的 所 有 阶 矩 存 
在 . 可 以 证 明 积分 等 于 零 , 4A X AM Y- Z 的 特征 函数 相等 , 也 就 是 特征 函数 
在 连续 的 支 集 上 几乎 处 处 相等 . 由 于 支 集 含有 原点 ， 在 零点 对 特征 函数 Taylor 展 
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开 ， 不 难得 出 两 个 分 布 的 所 有 阶 矩 相等 ， 也 就 是 ， 这 两 个 变量 同 分 布 ， 充 分 性 的 证 
明 很 显然 . 

检验 统计 量 的 构造 是 通过 把 分 布 用 经 验 分 布 替代 . 如 果 选 择 合适 的 权重 函数 ， 
检验 对 于 任何 的 固定 备 择 假设 都 相合 ， 本 章 Wa(-) 选择 为 正 态 或 均匀 密度 函数 . 

由 于 已 {pr(tz)} 含有 关于 Y 的 积分 ， 很 难得 到 简单 的 分 析 表达 式 ， 又 因为 
已 知 Y 的 分 布 ， 可 以 用 NMCT 的 方法 逼近 它 . 

ASREBEE, X 独 Y 可 分 解 ,有 | [pe (Es (yy (va)}]Walt) dt = S ||.{pr(tz)}l 
Walt) dt ， 其 中 F(t) 为 f(t) 的 共 轿 函数 .因此 











[ecto wa a [estore yl? mor- n. 
MT HARER T, 估计 了 ， 也 就 是 ， 如 果 Fnz 表示 z1,… ,zn 的 经 验 分 布 ， 有 
二 ff od Fns (2)||’Wa (t) dt 


= fifo £)dFnz(2)| W, 20d+ [| f sine) Faz (x 人) Wa( 


显然 ， 如 果 X 的 分 布 函数 Fe ESE, Th 为 了 的 相合 估计 . 
类 似 地 ， 记 Fae 表示 4,… ,zn 的 经 验 分 布 函数 ， Tr 的 估计 为 


Tu, = / Il f py (t'z)dFaz|| Walt) at 
正如 上 述 所 提 到 的 ， Y 的 积分 很 难 有 简单 的 分 析 式 子 ， 但 是 关于 积分 的 计算 不 是 
必须 的 ， 只 要 给 定 z1,… ,zn ， 由 第 1.2 节 中 提出 的 检验 步 又， Ta 是 常数 ， 如 果 
统计 其 中 不 含有 这 个 常数 项 ,根据 NMCT 方法 产生 的 对 应 统计 量 的 条 件 值 对 bp 值 


没有 影响 ， 因 此 ， 只 考虑 基于 Ta 的 NMCT 步骤 . 
对 于 某 些 常 用 的 权重 函数 ， 如 正 态 和 均匀 密度 函数 ， 可 得 T, 积分 的 显示 表达 


命题 2.2.1 记 Wa(t) = (2ra)-a/2exp ( — |lt\|?/2a?), 
1 Š 1 
Tam a Doe (al -25)|?a?) =: Ty, (2.2.1) 
如 果 te [-a,a]4?, A Walt) =(2a)-4; 否则 Walt) =0, 
il d sin {alzi — Zz7)k} R 
h= LI aaa Pa i (2.2.2) 


其 中 ， (ti-a) 表示 (zi 一 zj) HR RDDE. 
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证 由 于 正 态 分 布 N(0,a27a) 的 特征 函数 为 exp(-a2?llzl?/2) ， 因 此 
/ Il | et'*dFyz(a)||Wa(t) dt 
= = x Je w (23—21) (Qnra) 4 exp (- {lel 2/24?) dt 


pi 
= 4 È æ(- ile -ao 
jk=1 


关于 式 (2.2.2), hF cos(x) cos(y) + sin(z) sin(y) = cos(z — y), H. [-a,a]t 上 
的 均匀 分 布 对 称 ， 所 以 它 的 特征 函数 为 实数 ， 因 此 ， 


Ta = / | / e! 2AF,a(2)|| Walt) dt 
J | / cos(tz)dFnz(z)| Walt) dt + f | i sin(t'z)dFna (0)|?Wa(t) dt 
= 证 3 (2a)-4 [ts 一 zh)} dt 


= aD J osag -adt 
jy i 


= a Ji Re th a role(s, -ao 


Dk=1 


= 4 5 eS, ,xPplit{a(z; - ax) }iJ ats} 


jk=1 


= = D ei, ,expliti{a(z; 一 ax) }i) ats} 
ik= 
2 LST] sin {a(x; i 3 1 


a(x; — Ti)k n’ 





Th 


ify k=1 


其 中 ， Rel) 表示 复数 的 实数 部 分 . 

注释 2.2.1 用 /的 相合 估计 户 ， 如 样本 均值 或 者 样本 中 位 数 ， 估 计 u 通过 
蒙特 卡 罗 方 法 产生 数据 拓 ah, T r = yi hzi- À) = yi zi BR aye, 
不 难得 到 相应 的 统计 量 了 ， 记 为 Ty 或 者 Ty. 因此 ， 产 生 m 组 参考 数据 可 得 m 
个 工 值 , 不妨 记 为 Ti ,Tm ,逼近 统计 量 的 分 布 .事实 上 ， 只 要 严格 按照 1.2 节 
中 的 检验 步骤 就 可 以 了 ， 只 要 应 为 J 的 相合 估计 ， 统 计量 就 是 渐 近 有 效 的 . 
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2.3 ”模拟 和 实例 分 析 


2.3.1 ”模拟 说 明 

本 节 通 过 模拟 研究 统计 量 Ty 和 Tu 对 反射 对 称 、 椭 球 对 称 、Liouville-Dirichlet 
和 对 称 刻度 混合 分 布 做 检验 时 ， 用 NMCT 逼近 法 所 计算 的 模拟 结果 .同时 与 自助 
检验 法 所 得 到 的 模拟 结果 做 比较 ， 最 后 通过 实例 分 析 说 明 本 章 中 所 提出 方法 的 数 
值 结果 

为 了 说 明 NMCT 通 近 的 结果 ， 考 虑 与 以 下 自助 检验 统计 量 做 比较 : 


T= | lez) = pel = Èire) -Bfoy CDN Weld dt, 


HEF, pit) 表示 由 {21 ,zn} 产生 的 自助 数据 Gi- Tn) 计算 得 到 的 经 验 特 
TERZ, Selt) 为 {z1,… ,zn} 的 经 验 特征 函数 ; 由 {z1,… , zn} 产生 的 自助 数据 记 
A {ziea} Bs lert 2*)} 表示 py (tz ) RAIS, 类 似 地 ， 户 .{py(t'z)} 
表示 py (tz) 的 样本 均值 . 由 正 态 和 均匀 密度 函数 做 权重 的 T* Sy HN Th 
ATG. 
2.3.2 ”模拟 计算 

在 模拟 计算 中 ， 临 界 水 平 a = 0.05 ， 样 本 大 小 为 n = 10 和 20， 随 机 向 量 
X 的 维 数 d = 2,4 和 6. 对 每 组 样本 ， p 值 通过 重复 1000 KARE RUE. E 
1000 次 试验 中 ， 拒 绝 原 假设 的 次 数 为 功效 的 估计 .随机 向 量 的 分 布 为 两 分 布 的 卷 
积 和 Nx {b(x? 一 1)} ， 其 中 ，N 表示 原 假设 下 假定 的 分 布 ， x? — 1 表示 d 维 中 心 
化 的 卡 方 分 布 ， 且 自由 度 为 1. 在 模拟 中 ，6 = 0 和 b= 1 分别 对 应 于 原 假设 和 备 
择 假设 . 本 节 也 研究 了 权重 函数 Wal) 中 的 参数 对 统计 量 Ty 和 Tu 的 影响 .参数 
a 的 不 同 取 值 为 a= 0.5, 2, 3.5, 5 和 7.5. 用 样本 均值 估计 未 知 的 位 置 参数 . 


1. 关于 椭 球 对 称 分 布 的 检验 


F D = N 表示 正 态 分 布 N(0, Ja). 显然 数据 均值 为 零 , 但 是 在 下 面 的 分 析 中 ， 
分 别 讨论 均值 已 知 和 未 知 的 情况 . 图 2.1 表示 检验 Ty 和 Tw 的 功效 随 着 a 的 变化 
趋势 ， 本 节 只 给 出 均值 已 知 的 模拟 情况 ， 因 为 均值 已 知 时 NMCT 逼近 的 模拟 结果 
与 自助 法 逼近 的 模拟 结果 和 均值 未 知 的 结果 类 似 ， 从 图 2.1 中 看 ， 对 统计 量 Tv ， 
选择 a = 2 的 模拟 结果 较 好 ， 然 而 对 Ty ,选择 a = 5 可 能 会 更 好 .总 体 来 说 ， Ty 
的 功效 比 Ty 的 功效 差 一 些 . 表 2.1 给 出 了 a =5 时 Tw 和 Ty 的 经 验 功效 . 
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2.3 ”模拟 和 实例 分 析 
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图 2.1 用 NMCT IGEA ERI EEA A N E R 
实 线 和 点 划 线 分 别 表示 用 正 态 密度 函数 和 均匀 密度 函数 做 权重 的 模拟 结果 ; a 为 权重 函数 所 包含 的 参数 
表 2.1 MERE: a= 5 时 的 经 验 功效 
检验 位 置 参数 已 知 位 置 参数 未 知 
N Nx (x?—1) N N x(x? — 1) 
d=2 n=10, Tv 0.048 0.237 0.033 0.237 
n=10, TX 0.071 0.213 0.028 0.208 
n=20, Ty 0.053 0.407 0.047 0.410 
n=20, Ty 0.061 0.393 0.039 0.397 
d=4 n=10, Ty 0.050 0.430 0.037 0.427 
n=10, Ty 0.069 0.421 0.029 0.410 
n=20, Ty 0.048 0.470 0.043 0.463 
n=20, Th 0.061 0.447 0.040 0.458 
d=6 n=10, Ty 0.062 0.450 0.053 0.440 
n=10, TS 0.074 0.442 0.045 0.430 
n=20, Ty 0.044 0.430 0.053 0.420 
n=20, Th 0.063 0.442 0.044 0.426 





如 果 样 本 其 较 小 ， 即 n = 10 ， 在 位 置 参数 已 知 的 情况 下 ， Tu 在 原 假设 下 的 
功效 接近 给 定 水 平 a = 0.05 ; 然而 ,在 位 置 参 数 未 知 的 情况 ，Tw 的 结果 比 给 定 水 
平 低 一 些 . 在 样本 大 小 n = 20 时 , 模拟 结果 相对 要 好 一 些 . 自助 检验 Th 的 结果 也 
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有 类 似 的 结论 ， 但 Ty E TS 的 功效 好 ， 且 Tw 在 原 假设 下 更 接近 临界 水 平 ， 从 模 

” 拟 结果 可 以 看 出 ,蒙特 卡 罗 检验 和 自助 法 检验 受 数据 维 数 的 影响 较 小 ， 虽然 20 个 
数据 点 在 6 维 数据 空间 相当 稀 琉 ， 但 模拟 结果 还 可 以 ， 维 数 问题 和 讨厌 参数 对 这 
个 例子 的 结果 影响 不 大 . 


2. 关于 反射 对 称 分 布 的 检验 

M D = 表示 标准 正 态 分 布 N(0, 14). 数据 的 均值 为 零 ， 类 似 于 椭 球 对 称 分 
布 情形 ， 分 别 研究 了 均值 已 知 和 未 知 两 种 情况 . 图 2.2 给 出 功效 函数 的 图 示 ， 从 图 
2.2 中 可 以 看 出 ， 选 择 均匀 密度 函数 为 权重 时 ， 参 数 a = 2 的 功效 较 好 ， 然 而 ， 如 
果 取 正 态 密度 为 权重 函数 ,参数 a 的 选择 依赖 于 样本 的 大 小 . 样本 m = 10 ，a=5 
的 模拟 结果 较 好 ; 样本 n= 20 ， 选 择 a = 2. 与 椭 球 对 称 分 布 情形 比较 ， Tv 的 功 
效 比 Ty 的 结果 好 . 
































1 - Ip 一 - 
d=2,n=10 | d=2, n=20 
| 4 
A 
Eos z Ros oN SS 
R ae ae — R | ~， ` 
4 x Ge 、 
a ar , ae ee 
0 Sms J 0 
0 2 4 6 8 0 2 4 é 8 
a 
1 一 ip 
d=4,n=10 d=4, n= 20 
x Ros poa 
a” ee a R 人 个 
7 S, 
Ca Die ce + we 
ol. = 二 一 二- ol 一 一 一 二 一 一 
0 2 4 6 8 0 2 4 6 8 
a 
(eee 1 一 一 一 一 — 
d=6,n=10 i | d=6,n=20 
x Has eS 
Bos gS N Ros N — 
7 s 1 ~N 
z SS / a 
0 = 0 = 
0 2 4 6 8 0 2 4 6 8 
a a 


图 2.2 用 NMCT 逼近 法 对 反射 对 称 分 布 检验 所 得 到 的 经 验 功效 
实 线 和 点 划 线 分 别 表示 用 正 态 密度 函数 和 均匀 密度 函数 做 权重 的 模拟 结果 ， a 为 权重 函数 所 包含 的 参数 


表 2.2 和 表 2.3 给 出 =2 和 “=5 时 ,统计 量 Tr 和 Tr 的 经 验 功效 . 与 1 的 
结果 类 似 ， 维 数 问题 对 检验 的 功效 影响 不 是 主要 因素 ，Tw 和 Ty 在 原 假设 下 与 给 
定 水 平 都 很 接近 ; 随 着 维 数 的 增加 , 检验 的 功效 降低 ; 位 置 参数 已 知 时 的 检验 功效 


2.3 模拟 和 实例 分 析 
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比 位 置 参 数 未 知 时 的 功效 好 一 些 ; 用 自助 法 所 得 到 的 检验 结果 与 1 的 结果 类 似 . 


总 之 ， 它 比 其 他 检验 方法 得 到 的 结果 差 一 点 . 
表 2.2 ”反射 对 称 ， 位 置 参 数 已 知 时 的 经 验 功效 




















a=2 
N N x(x? -1) K Nx (x2 一 :1 入 
d=2 0.056 0.370 (a = 5) 0.030 0.515 
0.072 0.365 (a = 5) 0.040 0.507 
0.056 0.783 (a = 2) 0.047 0.714 
0.067 0.774 (a =2) 0.042 0.701 
d=4 0.061 0.483 (a = 5) 0.053 0.550 
0.068 0.472 (a = 5) 0.062 0.527 
0.040 0.697 (a = 2) 0.060 0.733 
0.044 0.702 (a = 2) 0.077 0.712 
d=6 0.030 0.467 (a = 5) 0.037 0.533 
0.041 0.461 (a = 5) 0.044 0.522 
0.053 0.470 (a = 2) 0.064 0.673 
0.059 0.464 (a = 2) 0.074 0.659 








表 2.3 ”反射 对 称 ， 位 置 参 数 未 知 时 的 经 验 功效 


一 ”~ 

















a=2 
N N*(x2—1) N Nx*(x?—1) 
d=2 n= 10, Ty 0.050 0.296 (a = 5) n = 10, Ty 0.031 0.383 
n=10, T 0.058 0.299(a=5) n=10,T; 0.038 0.380 
n=20,Ty 0.051 0.707 (a=2) n=2,Ty 0.057 0.597 
n=20, Th 0.049 0.701 (a=2) n=20,7» 0.064 0.589 
d=4 n=10,Ty 0.043 0420(a=5)  n=10,Ty 0.043 0.430 
n= 10, Tx, 0.049 0.407 (a = 5) n= 10, Ty 0.045 0.433 
n= 20, Ty 0.054 0.590 (a = 2) n = 20, Ty 0.062 0.617 
n=20, Th 0.056 0.568 (a=2) n=20,T; 0068 0.607 
d=6 n=10,Ty 0049 0.433(a=5) n=l10,Ty 0056 0.530 
n=10, TR 0.053 0.430 ( 5) n= 10, Tọ 0.072 0.520 
n = 20, Ty 0.059 0.410 (a = 2) n= 20, Ty 0.065 0.643 
n = 20, Tx 0.058 0.397 (a = 2) n = 20, Ty 0.077 0.644 





3. 关于 Liouville-Dirichlet 分 布 的 检验 














用 D = LERRA expl So 2) 的 指数 分 布 ， 这 里 zt0 为 X 的 分 节目 光 
足 z@ > 0 (i = 1,… ,d). 对 于 这 族 Dirichlet 分 布 D(a), Z% a = (1,1,… ,1). 
图 2.3 给 出 随 着 a 的 变化 ， 检 验 功效 的 变化 ， 从 图 2.3 中 可 以 看 出 ， 统 计量 Ty 和 
Ty 在 参数 a = 0.50 时 功效 较 好 . 
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d2, 10 d=2, n=20 





























图 2.3 用 NMCT 通 近 法 对 Liouville-Dirichlet 分 布 检验 所 得 到 的 经 验 功效 
实 线 和 点 划 线 分 别 表示 用 正 态 密度 函数 和 均匀 密度 函数 做 权重 的 模拟 结果 ; a 为 权重 函数 所 包含 的 参数 


从 表 2.4 中 可 以 看 出 , 即使 协 变 基 的 维 数 较 高 , 功效 也 很 好 . 在 大 部 分 情况 下 ， 
检验 Ty 和 Ty 在 原 假设 下 接近 给 定 的 水 平 ,但 是 由 TN 和 Ty 所 得 的 模拟 结果 相 
对 差 一 点 . 

表 2.4 Liouville 7: a = 0.5 时 的 经 验 功效 
L Lx (x? 1) L Lx (x? -1) 











d=2 n=10, Ty 0.076 0.133 n=10, Ty 0.056 0.161 
n=10,T% 0.081 0.137 n=10,7% 0.070 0.157 
n = 20, Ty 0.063 0.200 n = 20, Ty 0.053 0.250 
n=20, T 0.063 0.201 n=20, Tọ 0.067 0.233 
d=4 n= 10, Ty 0.043 0.343 n = 10, Ty 0.060 0.322 
n= 10, T 0.061 0.322 n=10, Th 0.067 0.324 
n = 20, Ty 0.060 0.601 n = 20, Ty 0.056 0.543 
n=20, T} 0.065 0.580 n=20, Tọ 0.064 0.547 
d=6 n = 10, Ty 0.046 0.526 n = 10, Ty 0.051 0.540 
n=10,T% 0.060 0.508 n=10,Tġ 0.058 0.531 
n=20,Ty 0.063 0.757 n=20,Ty 0.043 0.723 


n= 20, Ty 0.068 0.740 





20, Tọ 0.054 0.711 
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4. 关于 对 称 刻度 混合 分 布 的 检验 
d 
HD = S RREK 2-4 exp(— 3 je |) 的 分 布 族 . 记 g(X) = > |x|, 
W X/g(X) 是 定义 在 Cd = fu:ue Re, > |u| = 1} 上 的 常数 , E g(X) 与 X/g(X) 


独立 ， X 的 均值 为 零 ， 接 下 来 分 别 分 析 位 置 参 数 已 知 和 未 知 的 两 种 情况 ， 功 效 随 
着 a 的 变化 趋势 在 图 2.4 给 出 , 从 图 2.4 中 可 以 看 出 ，Tr 中 权重 函数 的 参数 = 2 
的 功效 较 好 ， 然 而 Ty 的 参数 较 好 的 选择 为 = 3.5, 表 2.5 给 出 a = 3.5 时 的 经 验 
功效 ， 在 这 个 例子 中 ， Ty 的 功效 比 Tu 的 功效 好 ， 所 以 可 以 考虑 选择 正 态 密度 函 
数 为 权重 函数 . 
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图 2.4 用 NMCT 逼近 法 关于 对 称 刻度 混合 分 布 检验 所 得 到 的 经 验 功效 
实 线 和 点 划 线 分 别 表示 用 正 态 密度 函数 和 均匀 密度 函数 做 权重 的 模 所 结果， a 为 权重 函数 所 包含 的 参数 


在 这 个 例子 中 ， 变 量 的 维 数 对 功效 的 影响 较 大 ， Ty 在 原 假设 下 的 功效 接近 
给 定 水 平 ， 但 在 大 部 分 情况 下 ， 自 助 检验 Th 在 原 假设 下 的 功效 较 大 . 检验 对 备 择 
假设 不 是 很 敏感 ， 权 重 函数 的 选择 需要 进一步 研究 . 

总 之 ， 大 部 分 情况 下 ， 用 NMCT 方法 的 模拟 结果 在 原 假设 下 接近 给 定 水 平 ， 
比 自助 检验 法 得 到 的 结果 好 . 讨厌 位 置 参数 对 NMCT 方法 的 结果 影响 不 大 ， 但 变 
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基 的 维 数 和 选择 的 权重 函数 可 能 对 结果 有 影响 . 例如 ,选择 均匀 密度 函数 为 权重 函 
数 在 检验 反射 对 称 分 布 时 ， 模 拟 结果 较 好 然而， 对 于 椭 球 对 称 和 对 称 刻度 混合 分 
布 的 检验 ， 正 态 密度 权重 函数 的 模拟 结果 更 好 一 些 . 


表 2.5 ”对 称 刻 度 混合 分 布 。 a = 3.5 时 的 经 验 功效 























位 置 参数 已 知 位 置 参 数 未 知 
Ss Sx (x? —1) Ss Sx (x? -1) 
d=2 0.055 0.060 0.150 
0.058 0.062 0.147 
0.050 0.045 0.223 
0.054 0.048 0.227 
d=4 0.050 0.055 0.261 
0.055 0.058 0.250 
0.055 0.057 0.313 
0.056 0.060 0.301 
d=6 0.061 0.062 0.292 
0.059 0.067 0.279 
0.045 0.053 0.369 
0.047 0.059 0.354 
2.3.3 ”实例 分 析 


Royston(1983) 研究 了 一 组 数据 的 多 元 正 态 性 的 检验 问题 ， 本 小 节 也 对 这 组 数 
据 研 究 它 的 分 布 是 否 属于 某 分 布 族 . 测 基 到 的 数据 包括 血色 素 浓度 zj, 积 层 细胞 
基 z2, 白 血 细胞 数 基 zs, 淋巴 细胞 数量 zt, 嗜 中 性 粒 细胞 数 其 rs, 免疫 血清 铅 含 基 
z6. 数据 包含 103 个 观测 值 ， 在 分 析 之 前 ， 先 对 变 其 za z4, zs 和 ze 做 对 数 变换 . 
Royston 用 Shapiro-Wilks W 统计 其 检验 数据 的 分 布 是 否 服从 正 态 分 布 ， 他 的 结论 
为 : 这 6 个 变量 的 边际 分 布 可 能 是 一 元 正 态 分 布 , 本 节 用 统计 鞭 Tw 检验 数据 联合 
分 布 是 否 属于 反射 对 称 或 椭 球 对 称 . 通过 1000 次 蒙特 卡 罗 模 拟 确定 p- 值 ， 所 得 
p- 值 分 别 是 0.149 和 0.141 ,这 个 结果 不 能 给 出 足够 的 证 据 拒绝 这 两 种 类 型 的 原 假 
B. 另 一 方面 ， 由 za 和 za 的 散 点 图 可 以 看 出 它们 之 问 有 明显 的 线性 关系 上 且 相 关 
系数 为 0.61. 把 变量 zs 的 数据 去 掉 ， 对 剩余 的 数据 用 Ty 检验 联合 分 布 是 否 为 反 
射 或 酉 球 对 称 的 ， 所 得 ? 值 分 别 为 0.67 和 0.71 ， 也 就 是 接受 原 假设 ， 认 为 除 掉 za 
的 数据 的 联合 分 布 是 反射 对 称 ， 也 是 椭 球 对 称 的 . 


第 3 章 。 对 称 分 布 拟 合 优 度 检验 的 渐 近 性 


3.1 引 言 


第 2 章 对 四 种 类 型 的 多 元 分 布 研究 了 拟 合 优 度 检验 .在 实践 中 ， 由 于 对 称 分 
布 的 重要 性 ， 关 于 椭 球 对 称 分 布 和 反射 对 称 分 布 的 研究 比 其 他 两 种 类 型 的 研究 相 
HEL. 因此 ， 本 章 对 这 两 种 类 型 的 分 布 做 进一步 的 研究 . 特别 考虑 基于 分 布 的 特 
征 函 数 构造 的 检验 统计 量 的 渐 近 性 质 ， 第 2 章 讨论 的 椭 球 对 称 分 布 是 球 对 称 分 布 
的 拓展 ， 本 章 中 的 大 部 分 内 容 来 自 文献 Zhu 和 “Neuhaus (2003). 

定义 3.1.1 XX 表示 d 维 随机 向 量 ， 称 处 关于 均值 pE Rd 和 矩阵 A 的 椭 球 
对 称 分 布 ， 如 果 对 所 有 d x d iht H, HA(X — u) 的 分 布 相同 ， A 称 为 形状 
矩阵 ， 

不 难 证 明 ， 如 果 4 为 单位 矩阵 ， 且 j=0，X 的 分 布 为 椭 球 对 称 的， 读者 可 
参考 文献 Fang, Kotz 和 Ng(1990). 在 本 章 中 ， 假 定 X 的 协 方差 矩阵 了 正定， 此 
时 ，A 等 于 D. 如 果 X 为 椭 球 对 称 分 布 ， 己 -2(X — u) 也 是 椭 球 对 称 分 布 . 

对 称 分 布 是 多 元 数据 分 析 中 常见 的 分 布 ,类 似 于 多 元 正 态 分 布 ， 椭 球 对 称 分 布 
(简称 椭 球 分 布 ) 也 具有 很 好 的 特征 . 如 果 已 知 数据 变量 为 椭 球 分 布 , 正如 Friedman 
(1987) 所 说 ,我 们 仍然 可 以 用 传统 多 元 变 其 分析 所 使 用 的 工具 分 析 这 些 数 据 .在 数 
据 分 析 中 ， 对 高 维 数据 降 维 的 方法 近 些 年 已 经 有 很 多 相关 的 研究 ， 其 中 之 一 为 切 
片 逆 回归 (SIR) (Li( 1991)). 满足 SIR 所 假定 条 件 的 一 类 最 重要 的 分 布 就 是 椭 球 分 
布 ， 因此， 在 多 元 分 析 中 ， 关 于 椭 球 分 布 的 检验 很 重要 ， 也 就 是 ， 检 验 X 的 分 布 
是 否 椭 球 对 称 ， 而且， 如果 X 服从 反射 对 称 分 布 ， 可 以 近似 地 用 SIR 方法 降 维 ， 
关于 反射 对 称 分 布 的 定义 见 第 2 章 . 
































3.2 检验 统计 量 及 其 渐 近 性 


3.2.1 ”关于 椭 球 对 称 分 布 的 检验 
对 所 有 的 正 交 和 矩阵 H, ， 原 假设 
Ho: E(X — p) = HE“? (X 一 站 依 分 布 成 立 ， 
也 就 是 , 考虑 SX u) 是 否 为 椭 球 对 称 分 布 . 如 果 DVX- u) 为 椭 球 分 布 , 它 
的 特征 函数 的 复数 部 分 为 堆 , 即 对 所 有 te R M aest = {a:llall=1,a€ RY}, 
E(sin(tar 5~¥/?(X — p))) = 0. 
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上 式 的 经 验 形式 为 PP,{sin(tar4(X 一 问 )}. 其 中 ， Pa 是 基于 iid. 样本 点 X 
Xn 的 经 验 概率 测度 ， 即 对 任意 函数 f(-) ， Pn(f) = n Ejn 71CG) ， AF 
ro? ak SOM? ， 分 别 对 应 方差 已 知 和 未 知 的 两 种 情况 ， 户 等 于 /或 X 分 别 对 应 
均值 已 知 和 未 知 的 两 种 情况 ， 全 -1? 和 广 分 别 表示 样本 协 方差 和 样本 均值 . 
统计 量 的 定义 为 
Í f (VnP, {sin(ta’ A(X — â))}Pwlt)dtd v(a), (3.2.1) 
Sd JI 
其 中 ， wO) 为 定义 在 积分 区 域 1 上 的 权重 函数 ，v 为 S54 上 的 均匀 分 布 ， 本 章 I 
表示 实 线 RR 上 的 紧 支 集 ， 如 果 统 计量 的 值 较 大 ， 拒 绝 原 假设 Ho. 
为 了 研究 统计 时 的 渐 近 性 ， 定 义 如 下 的 经 验 过程 


n = {Va(Xn, fi, A, t, a) = VnPa{sin(ta A(X — i))}: (ta) € x S54}, (3.2.2) 
其 中 ， Xn = (X1,… Xn)". 统计 基 式 (3.2.1) 可 以 重新 写 为 
p EF i 2 
pe ie Sni åta) dw(t)dv(a). (3.2.3) 


在 原 假设 下 ， 下 述 定理 或 推论 说 明 经 验 过 程 Va 的 渐 近 性 质 . 为 简单 起 见 ， 假 
定 如 果 指 标 集 为 Ix St 的 Gaussian 过 程 的 样本 轨道 有 界 且 关 于 (ta) € I x 8t 一 
致 连续 ， 则 该 过 程 连续 . 

定理 3.2.1 È P(X =p) =0, E BI|X 一 J < o0, 则 在 原 假设 Ho 下 

1) OR u Dha, A| A =p. WAV, 依 分 布 收敛 到 中 心 化 的 连续 Gaussian 过 
4L Vi = {(Vilt,a) : (ta) E x 54} ， 对 任意 (t,a),(s,b) Ix S4, Vi 的 协 方 类 为 


E{sin(ta™ A(X — 1)) sin(sb” A(X — 1))}. (3.2.4) 
2) 如 果 多 是 未 知 参 数 ， 则 =X. 记 
k(t,a, x£) = sin(ta” A(z 一 月 ) 一 tar4(z 一 门 B(cos(tar4( 和 一 六) (3.2.5) 


过 程 Vi, 依 分 布 收 敛 到 中 心 化 的 连续 Gaussian 过 程 Vo = {V2(t,a) : (t,a) € I x 
S54} ， 对 任意 (ta), (s,b) ETx Si, Ve hz EH 


E{k(t, a, z)k(s, b, £)}. (3.2.6) 


Sith Tn 的 渐 近 收敛 可 以 根据 定理 3.2.1 直接 推导 得 到 . 
推论 3.2.1 在 已 知 或 未 知 两 种 情况 下 ， 检 验 统计 量 T, 依 分 布 分 别 收 化 到 


人 , J V2(t,a)d w(t) dv(a), i ‘ i V3 (t,a)d w(t) dv(a) 
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接 下 来 研究 统计 基 在 备 择 假设 下 的 性 质 . 为 了 记号 上 的 简单 , 用 sin (c) 表示 
sin(-) 的 i 阶 导数 在 点 < 的 值 . 如 果 存 在 ae S4 和 te 了 ,满足 Elsin(ta A(X —p))] 4 
0 ， 根 据 函数 Elsin(ta” A(X 一 办)] 关于 (ta) 的 连续 性 ， 可 得 Vn 收敛 到 无 穷 ， 则 
统计 量 Th 依 分 布 收敛 到 无 穷 . 这 说 明 检 验 关 于 全 局 备 择 假设 相合 . 接 下 来 考虑 统 
计量 在 局 部 备 择 假设 下 的 性 质 . 

假定 对 独立 同 分 布 的 d 维 向 量 X; = Xin, FE a > 0, E Xi 可 表示 为 
Zi+Yı/n(i=1, n), WW y= pn = E(Z) + E(Y)/n%. 如 果 Zi AMY; Ws, Xi 
的 分 布 为 两 分 布 的 卷 积 ， 其 中 Yi/n 分 布依 ne 的 速度 收敛 到 零 . 

定理 3.2.2 假定 下 列 条 件 成 立 : 

1) Z 和 YY 的 分 布 函数 都 连续 ， 且 Z 是 关于 均值 (2Z) PURE D 的 椭 球 
对 称 分 布 ; 

2) 用 1 表示 最 小 的 满足 下 面条 件 的 整数 














sup |Bilt,a)|=: sup |E((tarA(Y — E(Y))' sin (ta A(Z — E(Z))))| # 0, 
(ba)ETXSd (ba)ETxSd 
E(|IY ||") < co, E(IIY IPE?) < 0. (3.2.7) 


则 ac= 1/(20) H, oR Â= p, 

T = 人 [ea + By(t,a)/l!)?d w(t)d v(a); (3.2.8) 
wR A=X, 

Tha => I. [ea + Bi(t,a)/l!)?d w(t)d v(a). (3.2.9) 


这 里 “二 > ”表示 依 分 布 收敛 ， Vi 和 Vo 是 定理 3.2.1 所 定义 的 Gaussian 过 程 . 

注释 3.2.1 比较 推论 3.2.1 关于 统计 量 在 原 假设 下 的 渐 近 性 和 定理 3.2.2 关 
于 在 备 择 假设 下 的 渐 近 性 ， 可 知 统计 量 可 以 分 离 以 O(n-1/(2)) thik Rid RB 
假设 的 备 择 假设 .如果 1 = 1 ， 速 度 可 以 达到 On). fio, AÈ ZAH Ssi 
上 的 均匀 分 布 ，Y = (23 一 1,…,23 一 1) ,通过 一 些 初等 计算 ， 不 难得 出 
SUP(t,a)erxse |E(ta’ AY cos(ta7AZ))| #0 , 此 时 1=1. 如 果 2 和 了 独立 1>3， 
也 就 是 ， 统 计量 最 多 可 以 检测 到 以 On) 的 速度 偏离 原 假设 的 局 部 备 择 假 
设 . 事实 上 ,对 1=1,2， 显然 有 


sup |E((tarAY)! sin (ta7 A2))| =0. 
(ta)ETxSda 
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3.2.2 ”关于 反射 对 称 分 布 的 检验 
第 2 章 给 出 了 反射 对 称 分 布 的 定义 ,也 就 是 ，d 维 变量 XX 称 为 关于 u 的 反射 
对 称 分 布 ， 如果 
(X-u) 和 -(X — u) 同 分 布 ， 
从 反射 对 称 的 定义 可 知 ， 它 等 价 于 和 一 /的 特征 函数 的 复数 部 分 等 于 零 ， 即 
E{sin(t7(X —y))}=0, te Rd. (3.2.10) 


X1,… Xn 表示 与 X 独立 同 分 布 的 随机 变 晤 ， P(-) 表示 经 验 概率 测度 ， 基 于 式 
(3.2.10) ， 类 似 于 椭 球 对 称 ， 定 义 统计 最 


Qa=n f {Pilsin(e (X = 2) Faw) 


其 中 ，4 ARR, wO) 表示 Re LAYS, Palda) 的 定义 见 第 3.2.1 小 
节 ， 定 义 经 验 过 程 


{Un (Xn, fist) = VaP, {sin(t"(X — ja))} : t € A}, (3.2.11) 
其 中 ， Xn = (Xie Xn), ARR u RAMII. RRIHET AERE A 
Qa p) = f [Uma Xn fy Patt. (3.2.12) 


Heathcote, Rachev 和 Cheng (1995, 定理 3.2) 已 经 得 到 在 原 假 设 X -u = 
~(X =p) F, Uni 依 分 布 收敛 到 Gaussian 4U, Qo(Xn, A) 的 收敛 性 可 以 直 
接 根 据 他 们 的 结果 推导 得 到 .因此 ， 只 要 考虑 检验 在 局 部 备 择 假设 下 的 收敛 性 . 

为 了 记号 上 的 方便 ， 用 sin® WX) 表示 sin(.) 的 第 i 阶 导数 在 OX 点 的 值 . 
存在 a > 0 ,假定 ii.d. 的 4 变量 Xi; 可 表示 为 Zi + yi/n(i=1,--- n), H Z 
的 分 布 为 对 称 的 ，yi/n” 收敛 到 退化 分 布 ， 如 果 Z; 和 vy; 独立 ，X; 的 分 布 为 两 分 
布 的 卷 积 ， 接 下 来 的 定理 给 出 局 部 备 择 假设 下 检验 的 性 质 . 

定理 3.2.3 假定 下 述 条 件 成 立 : 

1) Z 和 y 的 分 布 函 数 连 续 ， 且 2 关于 已 知 的 几 反 射 对 称 ; 

2) 用 1 表示 最 小 的 满足 下 面条 件 的 整数 : 


sup|Bi(t)| := sup|E(t (y — Ey)! sin)(t"(Z — EZ)))| #0, 
teA teA 


E(P) < oo, 和 E(lyll HZI) < oo- (3.2.13) 


3.3 NMCT 步骤 23 





IBZ, 
{VnPa{sin(t (Z + y/n © — BZ — By/n'/))} :te A} 
= {vVnPa{sin(t" (Z ~ EZ)) + (1/U)Bi(t)} :te A} +op(1). (3.2.14) 


所 以 ， 下 式 依 分 布 成 立 
f { ViPp(sin(t?(Z + y/n'/@) — EZ — By/n¥/)))\"dw(t) 
A 
= J (U(t) + (1/1) By(t))2aw(t), (3.2.15) 
A 


HP, {U(t):t € A} 表示 Heathcote, Rachev 和 Cheng (1995, 定理 3.2) 中 所 定 
义 的 Gaussian it 42. 

注释 3.2.2 值得 一 提 的 是 ， 这 个 定理 的 结果 类 似 于 定理 3.2.2 的 结论 ， 根 据 
定理 知 ,如 果 局 部 备 择 假 设 依 O(n“) 的 速度 逼近 原 假设 时 ,统计 量 可 以 把 它们 
分 离 出 来 ， 如 果 偏离 的 速度 比 O(n-1/(2)) 慢 ， 统 计量 依 分 布 收 敛 到 无 穷 ， 在 1 二 1 
的 情况 下 ， 最 快 的 偏离 速度 可 达到 O(n-1/2). 例如 ， 如 果 Z 为 [-V3,V 引 4 上 的 均 
ADA, y=(22-1,---,23-1), A] SUPte{—1,1)¢ [E(t7y cos(t”Z))| #0, stt} l= 1. 
类 似 于 对 桶 球 对 称 分 布 的 检验 ， 如 果 Z toy 互相 独立 ， /1 至 少 等 于 3 ， 检 验 最 多 
可 检测 到 以 n-16 的 速度 偏离 原 假设 的 备 择 假 设 . 事实 上 ， 对 1 二 1,2 ， 有 


sup |E((t7y)' sin (7 Z))| = 0. 
te[-1,1)¢ 


3.3 NMCT 步骤 


3.3.1 NMCT 步 又 在 椭 球 对 称 分 布 检验 中 的 应 用 
在 原 假设 下 ， A(X — u) 是 椭 球 对 称 分 布 ， 有 
A(X = u) =U -A(X — WIRA R, (3.3.1) 


Hp, U = A(X ~ p)/AX -oll FE 84 上 的 均匀 分 布 ， 它 与 AX 一) 独立 
(Dempster, 1969). 因此 , 对 于 任何 St 上 的 均匀 分 布 忆 ，U.|4(X- 站 | 和 AX- u) 
同 分 布 ， 如 果 k 和 A 已 知 ， 此 时 与 第 2 章 所 讨论 的 情况 一 致 ， NMCT 方法 精确 
AR 

值得 指出 的 是 : 如 果 y 和 AAS, FA Tn 做 检验 统计 量 时 ， NMCT 步骤 需 
要 做 一 些 修改 .为 了 比较 的 方便 ， 仍 然 给 出 j: 和 4 已 知 时 的 算法 . 

步骤 1 模拟 54 上 的 iid. 随机 向 量 wi(i=1,… n), 3E Un = (u, ytin), 
得 到 的 参考 数据 为 ui JAX: -wll 
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步骤 2 给 定 Xn = (X1,… Xn), RER (3.2.2) 所 定义 的 经 验 过 程 ， 得 到 相 
应 的 条 件 经 验 过 程 ， 即 


Vai (Un) 
= {Vni(Xn, Xn,t,a) = VnPn{sin(ta7ul|A(X — p)|I)} : (t,a) € I x 8°}, (3.3.2) 


相应 的 条 件 统计 量 为 


Tu (Un) = J [Won Unta) Pawana). (3.3.3) 


SMS 对 步骤 1 和 2 重复 m 次 ,得 到 m 个 条 件 统计 量 的 值 , 记 为 TUP) = 
1,+++,m). 

$M 4 MUM) = Tm, p 值 的 估计 为 方 = k/(m+1), RBH 
Tns (UP )(5 = 0, 1 ,m) 大 于 或 者 等 于 Tor (UO) 的 个 数 . 

根据 命题 1.2.1 ， 可 知 检验 精确 有 效 . 

如 果 p BA, EEREN 4 未 知 ， 只 需 把 上 述 算法 包含 的 4 用 它 的 估计 Â= 
SOV? 替代 .如 果 /未知 ， 就 不 能 简单 的 用 它 的 估计 代替 得 到 算法 ， 由 于 统计 量 
的 构造 与 第 2 章 不 同 ， 相 应 的 处 理 方法 也 不 同 .如果 已 知 ， Va = Va, AN 
Vn = Vaz. 为 了 使 Vno 对 应 的 条 件 经 验 过 程 和 它 本 身 等 价 ， 首 先 化 简 Vz. 根据 三 
AFR, AR PaX =X HEtel flac St 上 一 致 成 立 ， 


VP, (sin(ta” A(X — X))) 
= Vil Pa(sin(ta” A(X — u)))) (cos(tar AP (X — p))) 


—Vni( Pa(cos(ta” A(X a »))) (sin(ta” AP, (X - w) 
= VinP,(sin(ta” A(X — p)) 
~via Pa(eos(ta” A(X — y)))) (sin(ta” APA (X ~ n))) + op(1). 


在 人 未 知 的 情况 ， 只 需 对 上 述 算法 中 步骤 2 的 条 件 经 验 过 程 改 为 
Vn2(Un) = {Vn2(Xn; Un, Â, A, t, a) : (t,a) € I x S4}. (3.3.4) 
其 中 ， 


Vn2(Xn, Un, jt, A, t, a) 
= VmPp{sin(tau-||A(X — )||)} 
~vinP, {cos(ta"u - ||A(X — Pll) sin(ta” Pa(u |A(X — fi)|\)). (3.3.5) 
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相应 的 条 件 统计 量 为 
Ta2(Un) = 人 if {Va2(Xn» Un, Â, Â, t, a)}2dw(t)dv(a). (3.3.6) 


以 下 定理 说 明 条 件 经 验 过 程 Wa(Un) 和 Vn2(Un) 分 别 与 它们 对 应 的 非 条 件 
统计 量 Vai 和 Vno 等 价 . 根据 下 述 定理 ,不 难得 到 Tra (Un) 和 Tw2(Un) 的 渐 近 有 
效 性 . 

定理 3.3.1 假定 定理 3.2.1 中 的 条 件 成 立 ， 对 于 几乎 所 有 序列 {X1 ,Xn， 

…} , 式 (3.3.2) 和 式 (3.3.5) 的 条 件 经 验 过 程 Vni (Un) 和 Va2(Un) RAD HiME BE BI 
Gaussian 过 程 Vi fo Vo, Vi fe Vo RX UAH 3.2.1. RRE, Vi 和 Vo RIERA 
统计 量 Vn 在 已 知 和 未 知 几 这 两 种 情况 下 分 别 对 应 的 极限 分 布 . 所 以 , A (3.3.3) 和 
A (3.3.6) 的 条 件 统 计量 Tai (Un) 和 Tna(Un) 的 极限 分 别 与 已 知 和 未 知 几 的 非 条 件 
统计 量 Tr 的 极限 ,也 就 是 【(Vi(a,t))?dw(t)dv(a) 和 五 = f (Vzla, t))*dw(t)dv(a) , 
几乎 处 处 相等 . 

注释 3.3.1 被 积 区 间 I 和 权重 函数 wO) 的 选择 是 非常 有 意义 的 问题 ， 值 得 
一 提 的 是 ， 在 有 些 情况 下 ,被 积 区 间 的 选择 不 是 很 重要 、 接 下 来 给 出 一 个 例子 说 明 
特征 函数 的 复数 部 分 在 RI 的 紧 子 集 上 ， 如 [一 2,2] x Si 等 于 零 等 价 于 这 个 复数 部 
分 在 整个 Re 空间 上 等 于 替 ， 假定 多 元 向 量 X 6542 HR A [b,b] x St, (6 > 0) 
存在 ， 则 对 任意 ae 354 ，X 的 线性 函数 arX HERR AL [b,b] 存在 ， 
其 中 b1 不 依赖 于 a. 如 果 X 的 特征 函数 的 复数 部 分 在 [—bo, b) x S4 LFFR, A 
a7X 的 特征 函数 的 复数 部 分 在 区 间 [一 bs, bs] 上 等 于 零 .不 难得 出 arX 的 所 有 偶数 
WHF FR, URAH AX 的 特征 函数 为 实数 ， 且 对 于 任意 a, aX 关于 原点 对 
称 ， 这 个 结论 说 明 : X 特征 函数 的 复数 部 分 在 整个 空间 Ra 上 等 于 零 ， 因此， 在 
这 种 情况 下 ， 被 积 区 域 的 选择 并 不 是 很 重要 . 

注释 3.3.2 Romano (1989) 提出 了 更 一 般 的 随机 检验 方法 .根据 Hoeffding 
(1952) 置换 检验 的 思想 ， 随 机 检验 基于 分 布 在 一 族 变 换 Gn 下 的 不 变性 构造 ， 见 文 
献 Romano (1989) 的 151 页 ， 椭 球 对 称 分 布 具 有 这 样 的 不 变性 ， 对 椭 球 对 称 分 布 
的 检验 ， 本 章 中 所 提出 的 检验 方法 与 Romano 的 方法 类 似 . 


3.3.2 NMCT 步 又 在 反射 对 称 分 布 检验 中 的 应 用 
如 果 中 心 化 的 参数 u 已 知 ， 给 定 Xa ， 定 义 如 下 NMCT 过 程 : 
{Va(En, Xn, t) = VnPa{sin(t"e - (X — u))} :te A}. (3.3.7) 


其 中 ， Pa 表示 基于 (ei, zi)(i = 1,… ,n) 的 概率 测度 ， e1,… ,en X iid. 的 ， 以 
相同 概率 取 值 +1 的 一 维 变量 ， E。 = (e1,… ,en). 所 得 的 NMCT 统计 量 为 


Qa(En, Xn) = / (Va (En, Xn,t))}?dw(t). (3.38) 
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如 果 被 积 区 域 4 是 [-w al4 ， 且 权重 函数 是 这 个 区 域 上 的 均匀 分 布 。 Ga(B， Xn) 
的 具体 形式 经 过 推导 得 到 ， 
QalEen. Xn) = f WalEny sbjzdutg 
[-a,q]¢ 
= BDI (3.3.9) 


i=1 j=1 


其 中 ， 





LTT sin(a(Xi — XI)k) _ Il sin(a(X; + Xj 一 2), 


Mines 
ED = I aa -Xz a(X; + X; 2u) 


k=1 
(z)k 表示 z 的 第 大 个 分 基 . 
EXE, AF. 


sin(x) - sin(y) = 5 (cost — y) — cos(x + y)), 
则 
Qon Xn) = (20) hes 2 {adam (Xin) dt 


=i {ea ref iM (Ks — sie (Xi - watheres 


ij=1 


15555 f(g- cos(ta- (X; — X; 
{Oe f costa: C2) 


i=) j=l 


一 cos(tra. (Xi 十 Xi 一 20))d these, 
zine 
= =i eiejI(i, j). 
用 “Re” 表示 特征 函数 的 实数 部 分 . 由 于 [1,1] 上 的 均匀 分 布 对 称 , 对 [-1,14 上 
KS u, A 
Ili, j) = 2-41 E(cos(ua - (Xi — X;)) ~ cos(u7a- (Xi + X; — 24))) 
= 274-1 (Re Ele «(XXi)) — Re Blew 0+2) 


d d 
= 2741 (Re [J Ble #95) -Re TT Ee aXe Xs-200))) 


k=l k=l 





1, 74 Xi — X; sin(a(Xi + Xj 一 
= 区 = (al ie) aT =a + 2u) 9), 


ea X-X) risi a(X; + Xi;— 2u) 
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证 毕 . a 

如 果 1 已 知 ， 根 据 第 1 章 的 结论 ， 不 难得 到 条 件 检验 统计 量 式 (3.3.8) 可 以 达 
到 精确 功效 ， 具 体 细节 不 再 累 述 . 

对 u 已 知 和 未 知 的 两 种 情况 ， 式 (3.2.11) 所 定义 的 过 程 不 同 ， 所 以 如 果 uK 
知 ， NMCT 方法 需要 做 一 些 修正 ， 为 了 保证 条 件 经 验 过 程 和 式 (3.2.11) 的 过 程 等 
价 . 类 似 于 式 (3.3.4) ， 条 件 经 验 过 程 的 定义 根据 以 下 推导 给 出 ， 用 样本 均值 估 
ita, Bl a= X. 可 以 证 明 下 式 在 te A 上 一 致 成 立 . 

VaP, (sin(t” (X — X))) 
= Va(Pa(sin(t"(X — 4)))) (cos(t” Pa(X ~ 4))) 


-V ( Pa (cos(t" (X — n)))) (sin(t” Pa(X = 1) 
= ViiPa(sin(t"(X — 1)) 
~vni Pa(cos(t”(X — ))) (sin(t” Pa(X = 1))) + op(1). 
因此 ， 给 定 X。 ， 定 义 条 件 过 各 
Una (En: Xn, X,t) 
= VinPa(sin(t"e-(X — X))) 
—vnsin(t" Pa(e- (X — X)))Pa(cos(t7e - (X — X))). (3.3.10) 
相应 地 由 NMCT 法 得 到 的 条 件 统计 二 为 
Q2(En,Xn,X) = J CalEn Xn XPa. (3.3.11) 
A 
以 下 定理 说 明 NMCT 统计 基 Qo 源 近 有 效 ， 
定理 3.3.2 假定 Xi ,X。,… 独立 同 分 布 的 随机 变 芋 ， 关 于 术 知 中 心 参数 


MARA ALARA. M EP, EL, 表示 独立 EB, ， 但 产生 方法 和 En 40E 6h 
向 量 ， 则 对 任意 0<a<1， 


dim, P{Q2(Xn,X) > m — [ma] 个 Q2(EY, Xn, X)” 值 } 
= lim P{Q2(BR, Xn, u) + op(1/ VR) > 


m — [ma] 个 (Q2( BY, Xn, u) + e9(1/Vin))” 1} 
2 [ma] + 1 


<a (3.3.12) 
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3.3.3 ”模拟 分 析 

NORA A, 第 2 章 已 经 给 出 一 个 模拟 分 析 . 在 本 节 ， 只 考虑 形状 参数 
未 知 的 模拟 , HEE: On BH, CAM; © jp 和 SIR. 统计 量 Thi, (i = 1,2) 
分 别 对 应 这 两 种 不 同情 况 . 本 节 只 给 出 椭 球 对 称 检验 的 结果 . 在 下 面 模拟 分 析 中 ， 
样本 量 n = 20,50 ， 随 机 向 量 X 的 维 数 4 = 2,4,6. 为 了 研究 检验 的 功效 ， 考 虑 
HE X =Z+b-Y , XE b = 0.00, 0.25, 0.5, 0.75, 1.00, 以 及 1.25 ， Z 为 正 态 分 
Ai N(u,2), Y 的 每 个 分 量 为 独立 同 分 布 的 x? 分 布 . 原 假 设 Ho 成 立 ， 当 且 仅 当 

= 0.00 ， 也 就 是 X 为 正 态 分 布 N(p, £). WMA b A 0.00, X 的 分 布 就 不 是 椭 球 

对 称 分 布 ， 在 模拟 中 ，A= 0， 呈 = 五 ， 即 2 是 从 分 布 N(0, Is) 中 产生 数据 ， 以 
下 分 析 分 别 假定 中 心 参数 和 形状 矩阵 未 知 或 已 知 ， 

给 定数 据 {(7i, 21),… (Yn, Zn)} ,对 样本 n=20 和 n=50, 通过 NMCT 方 
法 产生 1000 组 伪 随 机 向 其 Un. 对 样本 量 和 向 量 分 布 的 每 个 组 合 ， 试 验 重复 1000 
次 . 给 定 水 平 a = 0.05， 统 计 基 的 值 大 于 或 者 等 于 给 定 水 平 的 比例 称 为 经 验 功 效 ， 


表 3.1 样本 n = 20 时 检验 的 功效 








b 0.00 0.25 0.50 0.75 1.00 1.25 

d=2 Tri 0.046 0.201 0.332 0.584 0.776 0.870 
Tn2 0.043 0.223 0.391 0.578 0.630 0.663 

d=4 Tar 0.045 0.181 0.315 0.577 0.679 0.861 
Tn2 0.040 0.238 0.402 0.579 0.633 0.643 

d=6 Ta 0.053 0.195 0.345 0.581 0.667 0.860 
Tn2 0.038 0.251 0.407 0.576 0.616 0.654 





表 3.2 样本 n = 50 时 检验 的 功效 








b 0.00 0.25 0.50 0.75 1.00 1.25 

d=2 Thi 0.046 0.261 0.392 0.664 0.874 0.950 
Tn2 0.046 0.283 0.455, 0.648 0.797 0.853 

d=4 Ta 0.045 0.281 0.385 0.637 0.881 0.957 
Tn2 0.046 0.288 0.462 0.635, 0.831 0.850 

d=6 Thi 0.053 0.295 0.395 0.640 0.866 0.960 
Tn2 0.043 0.311 0.487 0.641 0.818 0.846 








从 表 3.1 中 看 ,在 原 假设 下 ,如 果 样 本 量 ”= 20, 检验 Ta 的 功效 接近 给 定 水 
FP, Tn 相对 有 些 保守 . 但 当 样本 量 增加 到 n = 50 时 ， Tao 在 原 假设 下 的 功效 就 
相对 好 一 些 , 见 表 3.2. 在 备 择 假设 下 , 如 果 b 的 值 较 小 ,比如 5=0.25,0.50,， 统 计量 
Tno 对 备 择 假 设 要 比 Ta 更 敏感 . 如 果 5 较 大 ， 模 拟 结果 正好 相反 . 统计 量 Ta 不 
需要 估计 位 置 参 数 ， 用 NMCT 方法 逼近 Ta 在 原 假设 下 的 分 布 应 该 更 准确 一 些 ， 
因此 , 在 原 假设 下 Ta 比 Tne 更 接近 给 定 水 平 . 如 果 样 本 量 增加 到 n = 50, H Tro 
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得 到 的 结果 更 接近 给 定 水 平 ， 见 表 3.2. 在 样本 n = 50 时 检验 功效 要 比 样 本 n= 20 
时 的 功效 好 ， 而且， 检验 功效 受 变量 维 数 的 影响 很 小 . 


3.4 定理 的 证 明 


本 节 给 出 关于 椭 球 对 称 检验 统计 量 的 相关 定理 证 明 ， 可 以 类 似 地 推导 得 到 关 
于 反射 对 称 检验 统计 时 的 相关 定理 的 证 明 ， 具 体 细节 就 不 再 累 述 . 

定理 3.2.1 的 证 明 Ghosh 和 Ruymgaart (1992) 已 经 证 明 ， 在 位 置 参 数 和 形 
状 和 矩阵 已 知 的 情况 下 ， 过程 你 依 分 布 收敛 到 Vi ， 且 它 的 方差 为 式 (3.2.4). 用 样本 
协 方差 矩阵 È 估计 形状 矩阵 ， 根 据 三 角 等 式 ， 有 5 


VinPp(sin(ta” A(X — 4))) 
= vinPp(sin(ta” A(X — u))) cos(ta” (Â — A)(X ~ u))) 
+vn(Pn(cos(ta” A(X — p))) sin(ta (Â — A)(X — p))) 
=: Ini(t,a) + In2(t, a). 


根据 maxi<j<n ||Xj — ul|/n'/4 > 0, a.s., /n(AA-? — Ia) = Op(1), 以 及 E(A(X - 
p) cos(ta” A(X ~ y))) = 0( 根 据 A(X — p) 椭 球 对 称 ) ， 下 式 在 (ta) € I x 54 上 一 
臻 成立， 


Inı(t,a) = VnPa(sin(ta” A(X — 1))) + Op(1/ Vn), 
Inalta) = ta” Vn(AA~ — 14)(Pa(A(X 一 站 costtar4(X — p))) 
= op(1). 


这 说 明 : 如 果 DRA, RRA AERE 区 之 后 得 到 的 V 与 马 已 知 的 时 候 
得 到 的 Vn 渐 近 等 价 ， 结 论 1) 证 毕 ， 对 结论 2) ， 根 据 下 式 ， 类 似 的 可 以 证 明 


Vn Px(sin(ta” A(X — ft))) = Vn Pa(sin(ta” A(X — 1))) cos(ta” A(fi — 1))) 
-Vn (Pa (cos(ta” A(X — 1))) sin(ta” A(f — u))) 
= Vin P,(sin(ta” A(X — 1))) 
vinta" A(fi — 1) E(cos(ta” A(X — u))) + op(1). 
定理 3.2.1 证 毕 . 


定理 3.2.2 的 证 明 首先 考虑 A= 4 的 情况 .不 妨 设 上 = 0 ， 样 本 Xin 的 协 
方差 矩阵 En = (An)?. 由 于 En 收敛 到 变量 Z 协 方差 矩阵 D. 对 正弦 函数 Taylor 
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展开 ， 则 对 任意 的 (ba) eI x St, 
s p Y 
VnP,{sin(ta’ An(Z + aap} 
1-1 
= VEP, (sin(ta" An 2)} + YO gaY OÐ VEP, la” An¥) sin? (tor An2)} 
i=l 


i< , yy tTY;)* appa 
+ D {lta An¥s)! (sin (ta An (Z; + ee ) — sin!(ta” An Z;))} 
j=l 


+7 Palliat An¥)! sin® (ta A, Z)}, (3.4.1) 


«SEH, (ta7 AnY;)* SPF 0 Ail ta” AnY; 之 间 . 式 (3.4.1) 右边 的 第 2 ，3 项 依 概 率 趋 于 
零 ,第 4 项 依 概率 收敛 到 (1!) E{(ta" AY)! sin® (ta AZ)}. 注意 到 E{ (ta? AY )Ż) sin 
(ta7AZ)} = 0 对 1<i<1-1 成 立 类 似 于 定理 3.2.1 的 证 明 ， 在 已 知 /的 情况 
下 ， 可 得 Va 和 Tr 的 收敛 性 . 

如 果 你 中 的 协 方差 矩阵 未 知 ， 注 意 到 





17(20) 
ymax, Iln 一 0， as. 


Vii(An — An) =Op(1), An — A = (1). 





而 且 
SUP(t,a)erxSé Pa (sin(ta” An(Z — E(Z)) + (Y — E(Y)/n'/@)) 
~sin(ta” Ay (Z — E(2))))| 
< cPallAn(¥ — E(Y))||/n/2) = O(n) as. 
和 


|1 — cos(ta” Pp (An(Z — E(Z)) + An(¥ — E(Y)/n¥/20)))| 


(ta)ETxSd 


< ¢(||PnAn(Z — E(Z))||? + ||PaAn(¥ — EY ))||?/n?” = O,(n-). 


类 似 于 定理 3.2.1 的 证 明 过 程 ， 可 得 你 的 收敛 性 ， 具体 细节 不 再 重 述 . 根据 你 的 
收敛 性 ， 易 得 T 的 收敛 性 . 
WR A= X, ERE 


SUP(t,a)erxs¢ 





Va( sin(ta” Py An((Z ~ E(Z)) + (Y — B(Y)/n/2))) 
~sin(ta” PyAn(Z ~ E(Z))))| 
< eVallAs (PY — E(Y))||/n/@ = O,(n-/@), 
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根据 上 述 不 等 式 以 及 三 角 等 式 ， 可 得 
VnP,(sin(ta Ân(Z + Y/n! (20 一 (Z+¥/nV)))) 
= VnPa(sin(ta’ An(Z + ¥/n/@) — (E(Z) + E(Y )/n™/®®)))) 
—VnP» (cos(ta” An(Z — E(Z))) sin(ta” PaAn(Z — E(Z))) + Op(n-V/2) 
= we ‘Pn (sin(ta’ A(Z — E(Z)))) 
+i 1 E{(ta” A( Y — E(Y)))'sin (ta7 A(Z — E(Z)))} 
B A(Z — E(Z)))E(cos(ta’ A(Z — E(Z))) + op(1) 
= Vz(t,a) + (1/1)Bı(t, a). (3.4.2) 
根据 上 式 可 得 式 (3.2.9)T 的 收敛 性 ， 定 理 证 毕 . 口 
定理 3.3.1 的 证 明 实际 上 ， 只 要 证 明 经 验 过 程 的 收敛 性 ,统计 量 的 收敛 性 根 
据 过 程 的 收敛 性 即 可 得 到 . 首先 证 明 给 定 X , RELE {Vn (Un, Xn, t,a) : (t,a) € 
Tx 54} 几乎 处 处 收敛 到 过 程 {Vi(t) : (t,a) E€ I x Sd} ， 这 个 极限 等 于 已 知 时 Vp 
的 极限 ， 关 于 Vnz(Un) 的 收敛 性 ， 可 以 用 类 似 Vni (Un) 收敛 性 的 证 明 过 程 . 
， 为 了 记号 上 的 方便 ， 用 Xj 表示 A(X; 一 u). 定义 


ne E le 

Di = (ma = EXP, 

Dz = {lim sup |: x sin(ta” X;) sin(sb” X;)) — E(sin(ta” X) sin(sb"X))| = 0}, 
N09 (t,a),(3,b) 


E D = DinD2. 根据 正弦 函数 的 Lipschitz 连续 性 和 对 一 般 函 数 族 成 立 的 Glivenko- 
Cantelli 定理 ( Pollard, 1984, 定理 II p24, 25), D 以 概率 测度 1 为 样本 空间 的 子 集 . 
在 以 下 证 明 过 程 中 ， 总 假定 {XXn} E D. 
对 定理 中 所 定义 的 经 验 过 程 的 收敛， 只 需 证 明 Fidis 收 敛 和 过 程 的 一 致 紧 . 关 
于 Fidis 收 敛 的 证 明 , 这 里 只 给 出 证 明 的 框架 . 对 任意 整数 大，(5 ,al)…… , (tk, ax) € 
Ix54, 记 


( = ye 
y (cov(sin(tia! z), sin(tral DD) 


需要 证 明 
VD = {Va (Un, Xn tirai) i= 1,- k} = N(0,V®). 
上 式 成 立 的 充分 条 件 是 ， 对 任意 大 维 向 量 Y ， 有 


TVP 一 NOV). (3.4.3) 
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注意 到 式 (3.4.3) 左面 的 方差 y (Covi) ,7 依 概率 收 剑 到 VO, RE, 
Goviı = nt $ B(sin( taf wll X5) sin tofu] Xi) XF u RMA, 如 果 VO = 
P 
0, BÈ (3.4.3) 自然 成 立 ;如 果 Vy > 0， 根 据 正弦 函数 的 有 界 性 和 中 心 极限 定 
理 的 Lindeberg 条 件 成 立 ， 
VV /V7VO7 一 NO,D)- 

也 就 是 ， 式 (3.4.3) 成 立 ， 因 此 Fidis a. 

接 下 来 证 明 过 程 的 一 致 紧 . 只 要 证 明 ， 对 任意 7 > 0 和 上 > 0， 存 在 5> 0， 
满足 

tim sup P{ sup Var (Un, Xn, t, a) - Va (Un, Xns3,b)| > 27| Xal} <e (3.44) 
其 中 ， [8] = {((t,a), (s,0)) : Ita 一 sbl| <5}. 由 于 极限 性 质 研究 的 是 n 一 o0 时 的 情 
况 ， 在 下 面 的 证 明 中 ， 为 了 使 证 明 过 程 相对 简化 一 些 ， 考 虑 n 足够 大 的 情况 . 

不 难 验证 :如果 维 向 量 刀 在 S4 上 为 均匀 分 布 ， 可 表示 为 e-u* ,这 里 e 
以 相同 的 概率 取 值 +1 ，w* Alu Sb, Ble 和 ut 独立 ,由 于 ce 入 独立 ，eu 
A u 同 分 布 ，e 和 eu 独立 ， 式 (3.4.4) 的 左边 可 以 写 为 


P{ sup vn Pa(sin(ta"e «uy XI) — sin(sbre u° IXI) > mf LXall} 

= P{ sup Vn\P2(sin(ta” u* |X|) — sin(sb"u* |] xj)| > n| IXnll} (3.4.5) 
其 中 ， Ps 表 示 符 号 测度 ， 这 里 等 于 在 uX 上 的 概率 质量 为 ei/n ， 符 号 测度 的 
定义 可 参考 文献 Pollard (1984, p14). 


接 下 来 考虑 给 定 Un = (ui un) 和 Xal 时 ， 式 (3.4.5) 的 条 件 概率 ， 根 据 
式 (3.4.5) 和 以 下 不 等 式 


|sin(ta"u* |X) = sin(sb"u" XID < ta — sl 1X, 
以 及 Hoelfding 不 等 式 ， 可 得 
P{ VTIP; (sin(ta” we XI) ~ sin(sb"u*|X|))) > nelita = sol] IXall, U3} 
< 2 exp(—7?/32). 


如 果 引用 链 引 理 (Pollard, 1984, p144) 的 结论 对 上 式 做 进一步 推导 ， 还 需要 证 明 : 
对 足够 小 的 5 > 0 ， 履 盖 积 分 


6 
Ta(6, ll- l, Tx S$) =f {2log{(N2(u, || - Il, Z x 5°))?/u}} ?du (3.4.6) 
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AR, HP, J-l de Re 上 的 Euclidean 范 数 ， BHR No(u, | |, 了 x S$) 的 定义 
为 : PELDA tosti, XER (ta) ETx S4 ， 有 mingis lta- tail] <u, 
使 得 条 件 满足 的 最 小 整数 ! 就 是 覆盖 数 . 

显然 


No(u/c, || Il, Z x S$) < cut. 
因此 ， 对 足够 小 的 5> 0 ， 


6 
Jal6, I+ M, Z x S9 < ef (—log u)/?du < côlogô < c51/2. 
0 


所 以 ， 式 (3.4.6) 成 立 . 根据 链 引 理 ， 存 在 [5] 的 可 数 稠密 子 集 [5]* ， 满 足 
Psupyay- Via|(Pe(sin(ta ut XI) —sin( sb" uw |X ))|>26cJ0(6, ,Tx so) Xall, Us} 
< 2c0. 

H Xal, MF 

vaP; {sin(ta” ul] X |) — sin(sb" ullX|})}, 


关于 ta 和 sb 是 连续 函数 ， 稠 密 子 集 [6]* 可 以 被 [9] 本 身 替 换 ， 因 此 ， 选 择 合适 的 
5, RFU, RAS, R (3.4.4) 的 一 致 紧 得 证 ， 所 以 ， 得 到 过 程 的 收敛 性 ， 也 就 证 
明了 Tri(Un) 的 收敛 性 . 根据 Â- A = op(1/ Vn) 和 及 一 k= op(1/Yn) ， 类 似 于 
Var (Un) 的 收敛 性 证 明 过 程 ， 可 证 Vno(Un) 收敛 到 Vo, WR Two 的 渐 近 有 效 性 . 定 
理 3.3.1 证 毕 . 


4 ”回归 模型 的 降 维 型 检验 


4.1 4] 言 


参数 模型 通过 含有 有 限 个 未 知 参数 的 函数 来 刻画 协 变量 X 对 响应 变量 的 
影响 . 模型 使 用 起 来 比较 方便 , 但 是 究竟 协 变量 和 响应 变量 之 间 是 不 是 满足 这 种 函 
数 关系 ， 统 计 推 断 结 果 是 否 正确 ， 先 对 模型 做 检验 就 非常 重要 . 

假定 (zt 加) (En Yn) X iid. 的 观测 数据 ， 数 据 满足 下 面 的 关系 : 


=97) +E i=1,.…,n, (4.1.1) 


其 中 ， 的 维 数 是 1 ， zi = (P, 0) 为 d 维 列 向 晤 ， 且 ei 与 ri 独立 . 本 
章 检验 的 问题 是 ， 在 原 假设 下 ， 





Ho : d(x) = $o(-, 8) (4.1.2) 


对 某 些 6 成 立 ， 其 中 ， 各 (.) 是 已 知 函 数 . 

对 式 (4.1.2) 的 假设 检验 问题 ， 文 献 中 有 很 多 非 参数 的 方法 ， 其 中 之 一 是 通过 
估计 ol) -pol b) 之 后 ， 并 基于 它 构造 检验 统计 量 ， 通常 用 局 部 光滑 的 方法 估计 
$9( 见 文献 Härdle, Mammen (1993)). 这 种 局 部 光滑 方法 的 优点 在 于 : 估计 用 到 数据 
的 局 部 信息 . 如 果 协 变量 是 一 维 的 ， 可 以 用 很 多 光滑 方法 ， 且 得 到 的 检验 有 很 好 的 
功效 . Hart(1997) 对 这 个 问题 做 了 全 面 的 综述 ， 且 包含 有 很 多 重要 的 参考 文献 . 
如 果 协 变 基 的 维 数 变 大 ， 用 局 部 光滑 的 方法 估计 %(.) 时 ， 要 求 数据 量 随 着 协 变量 
维 数 的 增 大 呈 指 数 增加 ， 另 一 种 检验 式 (4.1.2) 的 方法 是 全 局 光滑 的 方法 ， 此 方法 
PRH ĉi = yi 一 polzi Bn) 构造 统计 量 ， 其 中 Bo 为 8 的 估计 . 全 局 光滑 检验 包 
括 CUSUM 检验 (Buckley, 1991; Stute, 1997; Stute, González Manteiga, Presedo 
Quindimil, 1998) ;基于 更 新 变换 的 检验 (Stute, Thies, Zhu, 1998; Stute, Zhu, 
2002) ;以 及 得 分 类 型 的 检验 (Stute, Zhu, 2005). 

然而 , 在 实践 中 , 这 两 种 类 型 的 检验 方法 在 检验 残 差 和 协 变量 之 间 的 关系 时 缺 
ZRH. 因此 ， 实 践 工 作者 经 常 依 赖 于 残 差 图 的 方法 ， 如 通过 残 差 和 拟 和 值 ,或 
者 残 差 和 一 些 协 变量 的 散 点 图 做 模型 检验 . 但 是 如 果 协 变量 的 维 数 很 高 ,又 产生 了 
新 的 问题 , 特别 是 想 在 回归 函数 中 包含 所 有 可 能 的 协 变量 之 间 的 线性 组 合 的 情况 . 

本 章 提出 了 降 维 类 型 的 检验 , 找到 一 个 好 的 协 变量 的 投影 方向 画 散 点 图 , 构造 
检验 统计 量 ， 本 章 大 部 分 的 内 容 出 自 文献 Zhu (2003). 
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对 任意 t+， 考 虑 
In(t) = x 3 E(x, —a)I(é; < t), (4.1.3) 
其 中 ， I) 为 示 性 函数 ， 也 就 是 : MRE; <t, (&<t)=1, SWSFSE. È 
为 样本 zj(j = 1,… ,n) 的 协 方差 矩阵 ， 对 于 任意 ce S4 = {a:llall = 1} ,定义 
Tala) = a" (3 Dad)]e. (4.1.4) 


i=1 





BER SET ELE SON 
Ta = sup Ta(a). (4.1.5) 
acsi 


在 本 章 ， 通 过 最 小 二 乘 方法 得 到 8 的 估计 ba, BI 
Bn = arg min X (v; ~ bo(z3, 8). 
j=l 


使 得 Th(a) 在 ae 34 得 到 最 大 值 的 向 景 a。 ， 作 为 协 变 其 的 投影 方向 面 残 差 图 ， 由 
于 式 (4.1.5)7 和 a 分 别 是 矩阵 [ro Dh) nla)] 的 最 大 的 特征 值 和 特征 值 
所 对 应 的 特征 向 量 ， 因 此 ， 统 计 基 的 计算 相对 容易 一 些 . 

实际 上 , 构造 统计 量 式 (4.1.5) 的 思想 是 : 如 果 原 假设 成 立 , 误差 。 = y- polz, 6) 
和 协 变量 z 独立， 在原 假设 Ho F, 

E(2-1/2(X — EX)|e) = 0， 
RE DEX 的 协 方差 矩阵 ， 上 式 等 价 于 
I(t) = E[Z-'/?(X — E(X))I(e < t)] = 0 对 所 有 te R! 成 立 . 
因此 ， 对 任意 ae st, 
7O:=e[/eo)eoramole=u 


其 中 ， Fe 是 e 的 分 布 函 数 .统计 其 Tr = sup, Tala) X sup, nT(a) 的 经 验 形式 . 
如 果 Tn 的 值 较 大 ， 拒 绝 原 假设 Ho. 

统计 量 Th 不 需要 用 局 部 光滑 方法 估计 , 而 且 协 变量 投影 方向 也 很 容易 确定 ， 
避免 了 高 维 协 变量 所 带 来 的 维 数 祸根 问题 . 4.2 节 研究 了 统计 量 的 渐 近 性 质 ， 为 
了 得 到 p 值 估计 ，4.3 节 讨 论 了 自助 逼近 和 NMCT 逼近 的 相合 性 ，4.4 节 通过 模 
拟 分 析 比 较 自助 逼近 和 NMCT 逼近 所 得 到 的 检验 功效 ， 同 时 给 出 了 相应 的 残 差 
图 .4.5 节 讨 论 了 本 章 所 提出 的 方法 . 关于 4.2 节 和 4.3 节 中 定理 的 证 明 在 4.6 节 
中 给 出 . 
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4.2 检验 统计 量 的 渐 近 性 质 


在 研究 统计 量 渐 近 性 之 前 ， 先 给 出 最 小 二 乘 估计 Bn 的 线性 表示 . 在 一 些 正则 
REF, Bn 可 表示 为 


ba =B = = Ela, B)e, + op(1/VA), 
j= 
HH, LX, B) = (EX B))(45(X, 8) IHX, A), o JE to 关于 的 导数 
在 8 的 值 ， 特 别 地 ， 如 果 和 是 线性 函数 ， 
n = Sa XnYn, 


其 中 ， Xn = (za 一 En — 2), Yn = (y1 — 9, Yn — Ds Sn = (Xn X7). 
wnx) = (z2x ~ E(X))(46(X, BJ) L(X, 8) ， 下 述 定理 给 出 Ta 的 
渐 近 性 质 . 
定理 4.2.1 假定 6 的 密度 函数 fe AA, p(X, B) 关于 B 的 导数 oX, p) 连 
续 ， 存 在 6> 0 使 得 HX, B) 的 (2+8) MAERT, E 的 (X,B) 的 协 方差 矩阵 和 
X 的 协 方差 矩阵 O 都 正定 ， 则 在 原 假 设 Ho F, 


a 
In(t) = = DB? (a; — E(X))(I(e; < t) — F(t 
© F (a; ~ E(X) (Ie; < t) — FQ) 
+ Fel) (BIEX - ENAX, 6))"]) a D Lz, B)ej + op(1), 
j=l 


那么 ， In(t) 在 Skorohod 空间 D4{—c0, co] 上 ， 依 分 布 收效 到 Guassian 过 程 
I=B-f.-N, (4.2.1) 


HP, B= (Bi,… Ba) 且 它 的 各 个 分 量 Bi X Gaussian 过 程 ， HHS thes, Bi 
的 协 方差 函数 是 Cov(Bi(t), Bi(s)) = Fe(min(t, s))—F.(t)F-(s), Fe(t) 和 felt) 分 别 
是 上 的 分 布 和 密度 函数 ;，N 的 各 个 分 量 是 正太 分 布 N(0,a2V) , RPV = EVV). 
不 妨 记 了 的 各 个 分 量 为 1 中 ， 对 s <t， 19 的 协 方差 函数 是 
KO(s,t) = Fe(s) — Fe(s)Fe(t) + fe(s)fe(t)E(V®)? 
-fe(s) j: ele < dF. E(V. (5X — E(X)))') 


—felt) f el(e < s)dF-E(VP® (5X ~ E(X)))'), (4.2.2) 
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其 中 ， (D(X - E(X) 是 向 量 DX - E(X)) 的 第 i 个 分 量 ， 根据 过 程 
In(t) 的 收敛 性 质 ， 不 难得 出 Tn 依 分 布 收敛 到 T= sup, a7 ( SEI )dFe(t)) a. 

值得 一 提 的 是 ， 根 据 定理 4.2.1 的 结论 ， 并 不 能 确定 检验 的 p 值 ， 这 是 因为 我 
们 并 不 知道 T 分布 的 分 位 点 ， 但 是 可 以 考虑 用 NMCT 逼近 克服 这 一 困难 . 


4.3 RREZE 


首先 考虑 自助 法 逼近 原 假设 下 统计 量 的 分 布 ,对 本 章 的 统计 量 ,自助 法 的 基本 
PRE: 用 (cf, y{)i = 1,… ,n) 表示 参考 数据 ， 成 表示 由 参考 数据 根据 最 小 二 
乘 方法 得 到 的 估计 . 给 定 {(zl,ga)…… s (Zn,yn)} ， 相 应 In 的 条 件 过 程 是 
(t) =n} FEN; - x*)I(é} < t), (4.3.1) 
j=1 
SUP, 65 是 根据 数据 (ot, uf) BRIAR, WEE E = y — dolj By); ME po 
FERRER, E =y (Oaa, (EN 为 ot 的 样本 协 方差 矩阵 ， 相 应 Ta 的 
条 件 统计 量 是 


Ti = supa" | [(ROROVAF:O]a, (43.2) 


其 中 ，F% 是 基于 ef(i = 1,… ,n) 的 经 验 分 布 . 为 了 估计 检验 p 值 , 产生 m 组 数据 
deh j=l n}OG=1,---,m), BH mA THA. pi p= k/m, 
HH kW Ty 大 于 或 者 等 于 Th 的 个 数 ， 对 给 定 的 临界 水 平 w ， 如 果 方 < a ， 拒 绝 
原 假设 . 

我 们 可 用 三 种 不 同 的 蒙特 卡 罗 通 近 法 ，Wild 自助 法 、NMCT 法 ,以 及 传统 的 
自助 法 ， 接 下 来 分 别 说 明 三 种 不 同 的 算法 : 

算法 1 Wild 自助 法 . 记 


Ti =t, Y= polti, bn) +E}, 


其 中 ，e? 定义 为 





ej = wê, 
wt 是 iid. 的 有 界 权重 变量 ， 满 足 
E(wj) =0, Var(wi)=1, Elw*|® < co. (4.3.3) 


对 Wild 自助 法 ， 基 于 残 差 引 = y? 一 polti BA), HER (4.3.1) HARE It, 和 
式 (4.3.2) 的 条 件 统 计量 Th- 
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算法 2 NMCT 法 . 记 
z} =ei(Ti—Z),， & =ê- (3 Hotes) ei$0 (Ti, Bn), (4.3.4) 
j=l 


其 中 ， 权 重 变 基 ei 的 选择 和 Wild 自助 法 的 选择 方法 一 样 。 L(-,-) 的 定义 见 Bn 的 
线性 表达 式 ， 如 果 模 型 是 线性 的 ， 式 (4.3.4) 可 简化 为 z? = ei(zi — 2) 和 


==! (: Èa) af EE (4.3.5) 
j=l 


根据 式 (4.3.4) ， 不 难 构造 由 NMCT 法 得 到 的 条 件 过 程 和 条 件 统计 量 , 分 别 记 
为 Fo A Tho 
算法 3 传统 的 自助 法 ， 从 êi 中 产生 独立 的 自助 数据 ， 记 为 ef,… ,ex 定义 
zi =a 和 y? = polti, Bn) +e. 


所 得 到 的 残 差 ef = y? 一 po(zj, 成 ) ， 用 它 不 难 构造 相应 于 式 (4.3.1) 和 式 (4.3.2) 的 
条 件 过 程 和 条 件 统计 最 ， 分 别 记 为 My 和 Tts 

正如 文献 研究 所 得 ， Wild 自助 法 对 回归 模型 的 检验 是 非常 有 效 的 通 近 方法 . 
Stute, González Manteiga 和 Presedo Quindimil (1998) 通过 证 明 得 到 : 如果 用 基于 
残 差 标志 经 验 过 程 构造 检验 统计 其 , 传统 的 自助 法 不 相合 , 而 Wild 自助 法 相合 . 如 
果 用 数据 分 别 拟 合 参数 和 非 参数 模型 之 后 ， 基 于 两 个 拟 合 模型 之 差 构造 统计 量 ， 
见 文献 Hardle 和 Mammen (1993) ， 用 传统 自助 法 和 Wild 自助 法 逼近 统计 其 的 分 
布 ， 同 样 的 结论 成 立 ， 有 趣 的 是 ， 对 本 章 提出 的 统计 量 ， 结 论 正好 相反 ， 也 就 是 ， 
传统 的 自助 法 相合 ， 而 Wild 自助 法 不 相合 。 NMCT 逼近 也 相合 .以 下 的 定理 说 
明 传 统 自助 法 和 NMCT 逼近 的 相合 性 . 

定理 4.3.1 如 果 定理 4.2.1 的 假设 条 件 成 立 , 在 原 假设 Ho F, Ija 和 It 在 
Skorohod 空间 D#|—o0, oo] 上 以 概率 1 弱 收 敛 到 过 程 1* ,这 里 J* 和 定理 4.2.1 中 
定义 的 工 同 分 布 . 

下 面 的 定理 给 出 Wild 自助 法 逼近 的 不 相合 性 . 

定理 4.3.2 假定 w* 以 相同 的 概率 取 值 w* = El, < 的 密度 函数 关于 原点 对 称 
以 及 定理 4.2.1 的 假设 条 件 成 立 ， 在原 假设 Ho F, Iki 依 分 布 不 收敛 到 BR fe: N. 


4.4 数值 分 析 


4.4.1 ”功效 研究 
本 章 通过 模拟 分 析 说 明 本 章 提出 检验 的 模拟 结果 . 由 于 Wild 自助 法 对 本 章 
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所 提出 的 统计 量 不 相合 ， 只 比较 Stute , González Manteiga 和 Presedo Quindimil 
(1998) 的 检验 ( T3), NMCT ( Thy ) 法 (算法 2) ， 以 及 传统 自助 法 ( Tis )( 算 法 
3) 的 模拟 结果 .分析 的 模型 为 


y=a'z+b(c'z)? +e, (4.4.1) 


其 中 ，z 是 d 维 协 变量 ， d 的 取 值 分 别 为 4= 3,6. 如 果 d=3，a= [1237 和 
c=[2,1,17; 如 果 d=6，a= [1,2,3,4,5,6]" 和 c= |[6,5,4,3,2,1]". 为 了 研究 检验 
对 备 择 假设 的 敏感 性 ， 的 取 值 分 别 为 5 = 0.00,0.3, 0.7,1.00,1.50 和 2.00. b = 0.00 
对 应 于 原 假设 Ho, b+ 0.00 对 应 于 备 择 假设 .样本 量 n = 25 和 50 ， 给 定 水 平 
a = 0.05. 对 1000 次 重复 的 每 次 试验 ， 产 生 1000 组 参考 数据 . 
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图 41 图 (a) 和 (b) 是 3 维 协 变量 的 检验 功效 ， 图 (c) 和 (d) 是 6 维 协 变量 的 检验 功效 
实 线 、 点 划 线 ， 虚 线 分 别 表示 由 TS, Taz 和 Tra WERA OR 


图 4.1 表示 检验 的 功效 图 , 图 中 给 出 了 三 种 方法 的 模拟 结果 . 首先 , 根据 图 4.1(a) 
和 图 4.1(b) ， 随 着 样本 量 的 增 大 ，T;2 和 Tis 的 功效 明显 比 Ts 的 功效 增加 的 快 . 
图 4.1(c) 和 (d) 也 有 这 样 的 趋势 . 其 次 ,如 果 协 变量 为 6 维 , T3 的 功效 很 高 ,但 是 在 原 
假设 下 的 功效 与 给 定 水 平 相差 较 大 . 在 原 假设 下 , 功效 的 大 小 为 0.09(d = 6, n= 25) 
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和 0.083(d = 6，n = 50). HERMA, Tiz 和 Tt, 有 点 保守 . 再次， Th A Tis 
的 模拟 结果 差不多 . 由 于 Ti 的 算法 更 容易 实施 ， 对 这 个 例子 ， 可 考虑 用 Trh 逼近 
统计 量 的 分 布 . 


4.4.2 RB 

本 节 考虑 & 和 投影 协 变量 arzi 的 残 差 图 ， 这 里 a 表示 使 式 (4.1.5)T, 最 大 
的 方向 ， 根 据 模型 式 (441) 中 参数 的 不 同 取 值 ， 分 别 产生 四 组 样本 量 n = 50 的 
数据 ， 即 : © a= [1,1,27,90 =0; © a= [1,1,27,b = 1,c = [2,1,17 ; ® a = 
(1,2,3,4,5,6]7,6 =0; @ a = [1,2,3,4,5,6]",b = 1,c = [6,5,4,3,2,1]". b = 0 和 
5 = 1 分 别 对 应 于 线性 和 非 线 性 模型 ， 图 4.2 表示 原 假 设 下 拟 合 数据 得 到 的 残 差 和 
投影 协 变量 的 残 差 图 . 根据 图 4.2(a) 和 (c) 看 不 出 残 差 和 投影 协 变量 之 间 有 明显 的 

















关系 ， 但 图 4.2(b) 和 (d) 说 明 它们 之 间 的 关系 存在 . 
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4.2 FAA arz 的 散 点 图 ， 其 中 a 根据 式 (4.1.5) 得 到 
图 (a) 和 (b) 为 3 维 协 变量 时 b= 0 和 ,= 1 的 散 点 图 ; 图 (c) 和 (d) 为 6 维 协 变量 时 b = 0 和 = 1 的 
散 点 图 
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4.4.3 ”实例 分 析 


本 节 通 过 实例 研究 检验 的 性 质 . 考虑 Dawkins (1989) 研究 的 1984 年 奥林匹克 
运动 中 男子 各 种 不 同 径 赛 的 比赛 记录 的 数据 .文献 中 已 经 用 主 成 分 分 析 的 方法 研 
究 了 各 个 国家 运动 员 的 优势 , 以 及 在 各 种 长 跑 和 短跑 中 各 个 国家 的 相对 实力 . 对 55 
个 不 同 的 国家 ， Dawkins 分 别 记录 了 男子 100 米 ，200 米 ，400 米 ，800 米 ，1500 
米 ，5000 7K, 10000 米 以 及 马拉松 赛跑 中 获胜 的 最 快 时 间 . 感 兴趣 的 问题 是 : 各 个 
国家 的 短跑 实力 和 长 跑 实 力 之 间 有 没有 关系 ， 即 : 一 个 国家 如 果 长 跑 实力 强 , 是 不 
是 短跑 实力 同样 强 ? 正如 Naik 和 Khattree (1996) 对 这 组 数据 研究 时 ， 用 运动 员 的 
速度 ,而 不 是 获胜 的 最 快 时 间 研 究 更 合理 一 些 . 把 获胜 的 最 快 时 间 转 换 为 速度 ， 分 
别 记 为 21,… ,zs. 根据 主 成 分 分 析 的 结果 ， 认 为 100 米 ， 200 米 和 400 米 为 短跑 
项 目 ， 1500 米 及 以 上 为 长 跑 项 目 ， 考 虑 用 线性 模型 拟 和 数据 ， 响 应 变量 为 100 米 
短跑 的 速度 ， 1500 米 ， 5000 米 ， 10000 米 以 及 马拉松 赛跑 的 速度 (z5,… ,zs) 为 
协 变量 ， 由 TS, Tis 和 Tha 逼近 统计 量 分 布 得 到 的 p 值 估计 分 别 等 于 0.02 ， 0.08 
和 0.01. 因此 ， 拒 绝 原 假设 ， 也 就 是 认为 100 米 速度 和 长 跑 速度 之 问 不 存在 线性 关 
R. ME 4.3(a) 看 ， 残 差 和 arz 之 间 存 在 某 种 关系 ， 如 果 去 掉 Cook Islands 这 一 
地 方 对 应 的 数据 点 之 后 ， 用 数据 重新 拟 合 线性 模型 ， 残 差 图 4.3(b) 没有 明显 的 趋 
势 说 明 残 差 和 arz 之 间 存在 关系 ,去掉 这 个 数据 点 之 后 重新 用 Ts ， Th 和 Tr 
逼近 统计 鞭 在 原 假设 的 分 布 ，p 值 的 估计 分 别 是 0.57, 0.64 和 0.06, 此 时 可 维持 原 
假设 ，100 米 短跑 速度 和 长 跑 速 度 之 间 存 在 线性 关系 . 我 们 可 以 认为 Cook Islands 
对 应 的 数据 点 为 异常 值 点 . 
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图 43 图 (a) 和 (b) 是 残 差 和 arz 的 散 点 图 ， 其 中 a 根据 式 (4.1.5) 确定 ， 两 个 图 分 别 为 有 
Cook Islands 对 应 的 数据 点 和 没有 这 个 数据 点 的 两 种 情况 
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4.5 结 论 


本 章 提 出 对 回归 模型 降 维 类 型 的 检验 方法 ， 统 计量 和 残 差 图 通过 投影 协 变量 
得 到 ， 方 法 的 计算 很 容易 实施 ， 对 所 提出 的 检验 ， 模 型 必须 满足 协 变量 X 和 误差 
< 独立 这 一 条 件 ， 只 有 条 件 Ellr) = 0 成 立 不 能 构造 本 文 的 统计 量 ， 另 外， 本 章 中 
有 趣 的 发 现 是 。 Wild 自助 法 不 相合 ， 而 NMCT 法 和 传统 自助 法 相合 ， 这 说 明 用 
自助 逼近 的 方法 时 要 研究 它 的 相合 性 . 


4.6 定理 的 证 明 


为 了 简化 证 明 的 步骤， 本 节 不 妨 假设 X 是 一 维 协 变量 ， 9o(X, p) 是 线性 函数 
BX. ais 可 以 这 样 假定 ， 是 因为 从 渐 近 的 意义 上 讲 ， 如 (X,Bn) — p(X, 8) = 
(Bn 一 6B)"90(X, 8) ， 且 类 似 于 线性 函数 的 情况 ， Bo - 8 也 有 渐 近 线性 表示 . 所 以 ， 
对 一 般 参数 函数 的 证 明和 线性 函数 的 证 明基 本 上 一 致 ， 进 一 步 假定 Dy 
抢 阵 ， 且 用 单位 矩阵 本 身 估计 E, ， 用 这 种 估计 和 用 祥 本 协 方差 矩阵 估计 所 得 到 的 
渐 近 结果 一 致 . 

首先 给 出 一 个 引 理 ， 引 理 对 本 章 所 有 定理 的 证 明 都 非常 重要 ， 

引 理 4.6.1 假定 序列 On = O(n) 对 某 些 c> 1/4 成 立 ， 密 度 函 数 fe AH, 
且 存 在 5>0， 4# Ejjel? ti < co MH n> oo tt, 


12 
sup Ra(0n,t) = sup |e Le — Ez){I(e; — 0% (2; — Ex) < t) — I(e; < t) 
—Fe(t + O(a; — Ez)) + Fe(t)}| 
=: sup am Tj, Ej, Ôn, t)| — 0, a.s. (4.6.1) 
证 对 任意 7 > 0 根据 Pollard 对 称 不 等 式 (Pollard, 1984, p14) ， 对 每 个 上 


和 On, RE 


P{\Rn(On,t)| > 2} < 2 (46.2) 


27 *2 
成 立 ， 那 么 对 足够 大 的 7， 


pa 
P{gup|Rn(On:t)| >n} < Pel Lolan es nt > 1} (463) 


根据 Chebychev 不 等 式 和 假定 条 件 ， 式 (4.6.2) 的 左边 小 于 或 者 等 于 48,cov(2)/n. 
因此 ,只 要 n 足 够 大 , 式 (4.6.2) 成 立 . 对 式 (4.6.3) 的 右边 项 , 由 于 gl, 0n, t) 组 成 
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的 所 有 函数 组 以 多 项 式 的 速度 识别 有 限 多 个 点 (Gaenssler , 1983) ， 根 据 Hoeffding 
AEX (Pollard, 1984, p16) ， 存 在 岂 > 0 ， 


12 
Pgupl nm > HE -tEn E1 En} 


2 
< | cn” supexp -——___1 ____| Ja 1; (4.6.4) 


“wt | a2sup, 5 Loree nba 
其 中 ，“ 和 ”表示 取 最 小 .为 了 使 寡 函 数 中 分 母 有 界 ， 类 似 于 文献 ( Pollard, 1984, 
p31) 中 引 理 IL. 33 的 处 理 方法 ， 对 任意 cl > 0 ， 存 在 cx > 0 ， 满 足 


12 
sup SY Mes - Of (aj — Ex) < t) — (ey < tl = 0,(n~). (4.6.5) 
at OY j=1 由 


根据 Holder 不 等 式 ， 存 在 c2 > 0 ， gO t) 的 样本 均值 小 于 或 者 等 于 n Y 


j=l 
(aj — Ex)?*? 的 寡 和 ne 的 乘积 ， 这 说 明 式 (4.6.4) 的 右边 趋 于 零 ， 求 积分 可 得 式 
(4.6.3) 趋 于 零 ， 引 理 4.6.1 证 毕 . 
定理 4.2.1 的 证 明 对 Koul(1992) 定理 2.3.3 的 证 明 过 程 做 一 些 修改 , 或 者 根 
据 引 理 4.6.1 的 结论 ， 定 理 4.2.1 不 难 证 明 ， 具 体 细 节 不 再 资 述 . 
定理 4.3.1 的 证 明 先 推导 及 。， 根 据 及 的 表达 式 和 式 (4.3.5) , 


- Ad aue — (0R) £} < t) — Fi} 


其 中 ， 
Fi(t) = > 1(é; — (0%)" a} < t). 
Tho 可 分 解 为 
Ino(t) = Ra (t) + Rna(t) + Rna(t) — Rislt), 
其 中 ， 


RO = FEIE -a <1) - 16 < 
j=l 
— Ey [23 (1(E; — 9,23 < t) — I(ê; < t)))} 


Ral = ZEUG) FW} 
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Rit) = bel 一 (rz < t) = 16) <)}, 
1 Š sp 
Ris) = aL BABIO -RO (4.6.6) 


其 中 E 表示 关于 变量 w RED. KHER ||Onl] < clog n/n? 的 On 以 及 几乎 
所 有 的 序列 (1y) , (zn,yn),…} ， 根 据 OR = Op(L/Vm) ， 类 似 引 理 4.6.1 的 
证 明 ， 有 


Ri 一 0 as. (4.6.7) 


关于 t 一 致 成 立 ， 接 下 来 证 明 Ra 依 分 布 收敛 到 Gaussian 过 程 B, Ria 依 分 布 收 
SB fN, P Ris 依 概 率 收敛 到 零 . 根据 Pollard (1984, p157) 的 定理 VIL, XL 
平 所 有 序列 {(z 加 )… > (En Yn) e}, TIE Ror 的 收敛 性 . 证 明 的 基本 步 又 为 : 

HI, WEH Ri 的 协 方差 函数 几乎 处 处 收敛 到 B 的 协 方差 函数 .通过 一 些 初等 计 
算 不 难得 到 这 个 结论 ， 其 次 ， 验 证 是 否 满足 Pollard(1984) 定理 VIL21 的 条 件 ， 主 
要 是 文献 157 页 的 条 件 (22). 类 似 于 引 理 4.6.1 KEH, H z*(I(éE <) — Fa) 组 
成 的 所 有 函数 族 (这 个 函数 族 依赖 于 n) 依 多 项 式 的 速度 识别 有 限 多 个 点 ， 见 文献 
(Gaenssler, 1983), 根据 Pollard (1984, p150) 的 引 理 VIIL 15 ， 条 件 (22) 成 立 ， 略 去 
证 明 的 具体 细节 .注意 到 VnF 一 Fn) A n2 po 极限 有 限 ， 很 容易 证 明 Ray 

j 


收敛 到 零 ， 接 下 来 只 需 研究 Ra 的 性 质 ， 记 





Ria (t) -| x EOE; — (0723 < t) — Felt + (Bn — BY (aj — 2) + (05)? 23) 
j=1 
一 (CT(E < t) — Fe(t + (Bn — BY (z; — an} 


EE o 
=ef Seal} 


HF ê= e- (n — B) (zj 一 3) ,根据 Pollard (1984, p31) 引 理 II. 33 ， 对 几乎 所 有 
序列 {(21,y1) > s (Ens Yn) e} 


sup DOPE = o(a) as. 
j=1 


成 立 ， 类 似 于 引 理 4.6.1 的 证 明 ， 可 得 Ria 关于 t 一 致 依 概率 收敛 到 零 ， 根据 





46 定理 的 证 明 45 





Buy [aj (T(E; < t) — Felt + (Bn — 8)(xj 一下))] =0， 则 
Rial) — Rin) = Èr [E {F.E + (Bn — 6)" (xy = 2) + (0723) 
-F(t + (Ba — B) (2; -2))}] 
= 去 > Eq [x3 (04) 23] fe(t) + 0p(1) 


aE E>» Pu); - 3)(z; - are] felt) + op(1) 
=: Ey|-- HO + op(1). 
由 于 上 式 求 和 式 […] 渐 近 等 于 n 2 ， 根据 中 心 极限 定理 ， 对 几乎 所 有 序 
Å 


列 {Er y) (Eny) h}, RARES, LUMA fe N. Thy 的 
收敛 性 证 毕 . 
接 下 来 证 明 Is 的 收敛 性 ， 由 于 


Teall) = Ds- EJIE; = (0; = Ba)" (2s ~2) <1) - FiO), 
j=1 


其 中 ， 
Fu) = = 1G} — (Bi — bn) — 2) < t). 
j=l 
类 似 于 式 (4.6.6) ， 把 ia 分 解 为 
Kald = O + Ia + Kald - Fal), 
其 中 ， 
Jn = AL ~ Ex)((E} — 632 — 2) <1) - 1G <t) 
-EUG -02-3 <0) — 16 < DD, 


Jalt)= De - Ex){I(éj < t) — Fr(t)}, 


"i 


Tnalt) = = Yee ~ Ex)E*{|I(E5 一 bo — 2) < t) — 1(é; < t))}, 
= 


Tia = Se Yes - Ba) EHIE ~ Fa) (4.68) 
j=l 
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类 似 于 R(t) 的 收敛 性 证 明 ， 对 任意 满足 lbu|| < clog n/n? 的 0, ， 以 及 几乎 所 有 
序列 {(z1,91),… (fas Yn) ， 


Jz(t) — 0 as. 


RF t BMW, 这 里 E* 表示 关于 E 的 积分 . 分 别 与 Roy, Rig 和 Ria 的 收敛 
性 证 明 相似 ， 可 得 .及 1 依 分 布 收敛 到 B ， .及 RATE fN, AE 及 K 
概率 收敛 到 零 . 证 明 的 细节 不 再 重 述 . 

定理 4.3.2 的 证 明 证 明 的 过 程 和 定理 4.3.1 的 证 明 过 程 类 似 ， 这 里 只 给 出 证 
明 的 框架 记 





Ru = Fade ~ £){I(€5 — (Ba — Bn)” (2; — 2) < t) — I(E} < t)}. 


先 考虑 Ria- Ew R%a HP, 


Bu- Ria = Fe (a5 ~ 8) Bu wê ~ (8; ~ Ba)" (23 = 2) <1) — Muses < D), 


HH, Eu 是 关于 w* 的 期 望 . 由 于 成 -Bn = O(logn/ Jn) a.s. ,类似 于 引 理 4.6.1 的 
证 明 ， 对 几乎 所 有 序列 {(zb ya，…… , (zn,yn),…} ， 可 证 


Ra 人 (b — Ew Rya (t) — 0 as. 
在 te R! 上 一 致 成 立 ， 把 T(t) 分 解 为 
Tilt) = Rial) - Bu Rial) + Rig(t) + Bue Rial), 
其 中 ， Rts(t) = n-1/2 al 一 下 1(e; < t). 接 下 来 证 明 By Ray 依 分 布 收敛 到 


j= 


—fe N. 用 Ec,w 表示 关于 < 和 w 的 期 望 ， 定 义 





Ee w Ria (t) 


m = DOG) — DIF ey w; (wê; — (BA ~ Ba) (@j — 2) < t) — Bass Twhé; < t). 
j=l 


则 
Ew Rna(t) = {Ew Rng(t) — Ee,w Rag (t)} + Eeu Rian (t). 


类 似 引 理 4.6.1 的 证 明 过 程 ， 可 得 Ew Ris(t) — Ecw- Rig (t) > 0 a.s. Ete R! E 
一 致 成立， 现在 证 明 Ec,w- R%ai(t) 的 收敛 性 ， 由 于 对 每 个 ， Ew;T(wjé; <t) = 
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1/2I(ê; < t) +1/21(-é; < t), W 
区 1 y t= (a —P)t(z; — 2) 
Baute <0 = R(T ars e F) 
3( -rl( -t+ (Bn — B)Gy (a; — 2) )) 


2 1- (zj — 2)" S7 (£j — 2) 


这 里 (Bn — DB)o) = Sz! Diz; (ay — Dei. 根据 Taylor RFR, 





Bew (Ria (t)) 
2 -7z Xe 一 司 (oj — 2)" (Ba — B)(fe(t) + (fe(-t)) +0p(1) as. 
= — felt) - N + op(1) as. 


上 式 最 后 一 个 等 式 根据 fe 的 对 称 性 得 到 . 接 下 来 只 需 证 明 Ris 并 不 依 分 布 收敛 到 
Gaussian 过 程 B, ， 这 个 结论 只 要 对 每 个 上 计算 Ras 和 B(t) 的 方差 就 可 以 ， 事 实 
a 


„lim Var(R;s (9) = HAUG <t) - I(—e < t))?. 


上 式 不 等 于 Var(B(t)) = Fe(t)(1 一 (Fe (t)). 定理 证 毕 . 
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本 章 考虑 部 分 线性 模型 的 拟 合 优 度 检验 ， 部 分 线性 模型 的 定义 为 


Y=PBX+g(T)+e, 


其 中 ，X 是 d 维 随机 向 量 ， 了 是 di 维 随机 向 量 ， 6 是 d 维 未 知 参数 ， g(-) 是 未 
知 可 测 函 数 ; 给 定 (T,X), e 的 条 件 期 望 等 于 零 . 在 本 章 ， 不 妨 假定 X 的 均值 为 
零 . 关于 8 和 9 估计 的 文献 很 多 ， 如 Cuzick (1992), Engle et al. (1986), Mammen 
和 van de Geer (1997), Speckman (1988). 

如 果 用 部 分 线性 模型 拟 合 独立 数据 (th 21, y1), , (tn,zn 加 ) ， 对 模型 的 检验 
是 非常 重要 的 . 本章 研究 的 检验 问题 是 :在原 假 设 下 


Bo:BYIX=:T=:)=a+B .+9g() MH a, B Al g 成 立 ， (5.1.1) 
备 择 假 设 为 
Hı : E(Y|X =T =-) Fat p- +9(-) 对 任意 a, 6 和 g 成 立 . 


对 参数 模型 的 检验 ,文献 中 已 经 有 很 多 研究 . 例如 ， Dette (1999) 提出 基于 不 
同方 差 估计 的 检验 ， Eubank 和 Hart(1992) 研究 了 得 分 类 型 的 检验 ， Eubank 和 
LaRiccia (1993) 根据 变量 选择 提出 了 一 种 方法 ， Hardle 和 Mammen (1993) 基于 参 
数 和 非 参 数 拟 合 之 间 的 差异 构造 检验 统计 量 ，Stute (1997) 研究 了 非 参 数 主 成 分 分 
解 ， 在 协 变量 是 一 维 的 情况 下 , 得 出 检验 的 一 些 最 优 性 ， Stute, González Manteiga 
和 Presedo Quindimil(1998) 基于 残 差 标志 过 程 构造 统计 量 ; Stute, Thies 和 Zhu 
(1998) ， 以 及 Stute 和 Zhu (2002) 提出 的 更 新 过 程 可 以 很 容易 确定 p 值 ， Fan 和 
Huang (2001) 提出 了 适应 Neyman 检验 ， Stute 和 Zhu (2005) 对 单 指标 模型 研究 
了 得 分 类 型 的 检验 ; Hart (1997) 这 本 书包 含 很 多 关于 检验 的 文献 ， 本章 大 部 分 内 
容 出 自 文 献 Zhu 和 Ng (2003). 

本 章 通过 残 差 标志 经 验 过 程 构造 统计 基 . 文献 中 已 有 一 些 构造 统计 量 的 方法 . 
用 残 差 标志 过 程 检验 的 主要 原因 是 : 由 于 本 章 所 研究 的 是 多 元 协 变量 ,如 果 根 据 用 
参数 和 非 参数 两 种 方法 分 别 拟 合 模型 之 后 的 差异 (Hirdle, Mammen, 1993) 构造 检 
验 ,用 局 部 光滑 方法 估计 非 参 数 函数 , 可 能 会 带 来 维 数 祸根 问题 . 关于 适应 Neyman 
检验 (Fan, Huang, 2001) ， 非 参数 估计 g(-) 之 后 ,我 们 并 不 知道 检验 在 原 假设 下 的 
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分 布 是 否 好 处 理 . 而 且 ， 检 验 的 功效 依赖 于 函数 ej = yj — p'r- glt) 的 光滑 程 
度 . 正如 Fan 和 Huang (2001) 所 提 到 的 ， 在 某 些 情况 下 ， 如 何 光滑 函数 是 一 个 具 
有 挑战 性 的 问题 . 

另 一 方面 ， 基 于 残 差 标志 经 验 过 程 构造 的 全 局 光滑 检验 虽然 对 备 择 假设 是 高 
频率 的 回归 函数 不 太 敏 感 ， 但 是 它 具 有 如 下 很 好 的 性 质 : 

(1) 检验 对 所 有 全 局 备 择 假设 相合 ; 

(2) 检验 可 以 检测 到 以 n-1/? 的 速度 台 近 原 假设 的 局 部 备 择 假设 ; 

(3) 统计 量 的 渐 近 分 布 不 依赖 误差 的 分 布 ; 

(4) 只 需 用 非 参 数 方法 估计 低 维 的 非 参数 函数 9(.). 

在 文献 中 ， 拟 合 优 度 检 验 检 测 到 逼近 原 假设 的 备 择 假设 的 最 快速 度 是 n. 
适应 Neyman 检验 的 最 优 速度 是 O(n-29/(48+2) (Ig Ig n)9/(49+1)) 对 某 些 。 > 0 成 立 
(Spokoiny, 1996; Fan, Huang, 2001). 理论 上 讲 ， 这 说 明 本 章 所 提出 的 检验 对 某 些 局 
部 备 择 假设 更 敏感 ， 且 第 4 个 性 质 对 多 元 变量 的 回归 是 非常 重要 的 . 

由 于 统计 量 在 原 假设 下 的 小 样本 分 布 或 者 极限 分 布 并 不 容易 处 理 ， 为 了 估计 
?了 值 ， 和 第 4 章 的 处 理 方法 一 致 ， 用 蒙特 卡 罗 方 法 允 近 检验 在 原 假设 下 的 分 布 ， 对 
本 章 中 研究 的 部 分 线性 模型 中 含有 非 参 数 函 数 g(.) ， 处 理 更 复杂 一 些 ， 对 参数 回 
归 模 型 ， 已 经 证 明 传 统 自助 法 逼近 不 相合 (Stute, González Manteiga and Presedo 
Quindimil, 1998). 即使 是 Wild 自助 法 逼近 , 并 不 确定 它 一 定 相合 ,比如 在 第 4 章 
关于 参数 模型 的 检验 ， 以 及 第 7 章 关于 异 方差 性 的 检验 ， Wild 自助 法 都 不 相合 . 

为 了 解决 上 述 问题 ， 本 章 用 1.2.3 节 中 提出 的 NMCT 法 . 


5.2 检验 统计 量 及 其 极限 性 质 
5.2.1 ”构造 统计 量 的 思想 和 方法 
对 任意 权重 函数 wO), iE 
U(T,X)=X-E(X|T), V(T,Y) =Y - E(YIT) (5.2.1) 

以 及 

B=5TBII(TDX)Y(CTY)uo2(T)]，7(0 = E(YIT =2), (5.2.2) 
其 中 ,假定 5 = E(UU'w?(T)) 正定 ， 显 然 ， 原 假设 Ho 成 立 的 条 件 是 当 上 且 仅 当 

E(Y|X,T) = PU(T, X) +4(T). 


也 就 是 
El(Y — PU(T, X) — YT)(X,T)] = 0. 
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根据 条 件 期 望 的 定义 ， 上 式 等 价 于 : 对 所 有 te, 
E{[Y — P'U(T, X) — y(T)lw(T)I(T < t, X < 2)} =0, (5.2.3) 


其 中 ，“X <a” RRX 的 每 个 分 量 小 于 或 者 等 于 z 的 相应 分 量 ， 类 似 地 可 得 
TSO 的 定义 .基于 观测 数据 ， 式 (5.2.3) 左边 的 经 验 形式 为 


F Dy ~ BU) = alt hole ty < ty < 2). 
j=1 





其 中 , 参数 8 ,函数 B(XIT =-) 和 7(.) 分 别 用 对 应 的 相合 估计 启 ， 记 (XI = .) 和 
AORE, BURA 2; = yy — BO (t;,25) — F(t), HP O(ty, 2) = xy — ÊX lty). 
参数 0， 函数 Y(-) 和 EXIT =-) 的 具体 估计 表达 式 将 在 下 一 节 讨论 . 考虑 残 差 标 
志 经 验 过 程 


Ra(t,2) = aa DY swlts(t; < tz; <2). (5.2.4) 
j=l 


本 章 提出 基于 上 述 残 差 标志 过 程 的 检验 统计 量 
CW = [erora Fa(T, X), (5.2.5) 


其 中 ， Fn 是 基于 {(t, 21) , (tn,zn)} 的 经 验 分 布 . 如 果 CV, 的 值 较 大 ,拒绝 原 
假设 . 

值得 一 提 的 是 ，CV。 并 不 是 刻度 不 变 统计 量 . 在 通常 情况 下 , 用 常数 , 如 CV 
方差 的 极限 估计 ， 标 准 化 CVn. 如 果 可 以 得 到 检验 在 原 假设 下 的 极限 分 布 ， 且 通过 
此 极限 分 布 可 以 确定 p 值 ， 如 Fan 和 Huang (2001) ， 选 择 较 好 的 标准 化 常数 就 非 
常 重要 ， 因 为 它 的 选择 关系 到 检验 功效 的 好 坏 . 然而 ， 并 不 容易 选择 到 好 的 标准 化 
常数 . 但 是 ， 对 本 章 中 的 统计 量 ， 并 不 需要 标准 化 CV, ， 因 为 用 NMCT 逼近 时 ， 
给 定 (ti zi,yi) ， 它 永远 为 定常 数值 . 因此 ， 这 个 标准 化 常数 对 NMCT 通 近 产生 的 
条 件 分 布 没有 任何 影响 ， 这 是 NMCT 逼近 的 另 一 优势 ， 具 体 的 细节 见 5.2.3 节 . 


5.2.2 B 和 7 的 估计 
根据 式 (5.2.1) 和 式 (5.2.2) ， 构 造 6 和 7 估计 . 对 i=1,… ,n， 定义 


fi(ti) = = Skat —t;), 
I#i 
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B(XIT = 6) = ED kalt -tA 
jżi 


E(Y|T=ti) = = Dyiknlti —t;)/filti), 
j#i 
六 (tbzi = ti- Ê(XIT=ti) V(ti,y)=w-E(VIT = ti), 
$= BOTT) = LY Olt, zut). 
j=l 
IH, kalt) = (1/h)K(t/h) ， KO 是 假设 条 件 5.5.1 小 节 所 定义 的 核 函 数 ， 8 和 
7 的 估计 分 别 为 
B= (8) DO Vw WG), NH) = ÈT). (626) 
j=l 
Shit BOM 4 具有 以 下 渐 近 结果 . 
定理 5.2.1 假定 第 5.5.1 节 的 条 件 1~6 成 立 ， 有 
Vi(B -8) = SV) + Olly + Va”) 
(5.2.7) 


依 分 布 收敛 到 N (0, 8-1 B[U(T, X)U(T, X)'wi(T)e2]S-2) ， 其 中 N(0, 4) 表示 均值 
AK, WIREH 4 的 正 态 分 布 ， 且 对 任意 [ao 中 满足 DO<a<b<1， 有 


4 -o (i 
sp. A) — yO = Op( Tak +h). (5.2.8) 


5.2.3 ”统计 量 的 渐 近 性 质 
以 下 定理 说 明 Ra 和 CV, 的 渐 近 性 ， 记 


JD, X,Y,B,U,S, F(XIT),t,2) 
z ew) {U(r <t,X <2)- er <t, X <a)U(T, xX)yw(7)] S-1U(T, X) 


-F(XIDIT <9}, 


其 中 ， FT) ERRET, X 的 条 件 分 布 . 
定理 5.2.2 假定 第 5.5.1 节 的 条 件 1~6 成 立 ， 在 原 假设 Ho 下 ， 


Ra(t,2) = Fe M25 4508, U,S, F(a;|t;),t,2,) + o9(1) 
j=l 
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在 Skorokhod 空间 万 [一 co,+oeo](a+0 上 依 分 布 收敛 到 中 心 化 的 连续 Gaussian 过 程 
R, AES (t1,21) 和 (to,02), RODTEBRE 


E(R(t1,21)(R(t2, 22) (5.2.9) 


= BE(J(T,X,Y,B,U,S, F(X|T), tı, 22, )I(L, X,Y, B,U, S, F(X|T), te, 22). 


因此 ， CVn 依 分 布 收敛 到 CV := f R(T, X)AF(T, X), HP F(-,-) 表示 (T,X) 的 
分 布 函数 . 
下 面 研究 检验 对 局 部 备 择 假设 的 敏感 性 ， 考 虑 指标 n 的 备 择 假设 


E(Y|X,T) =a +8'X + 9(T) + 91(T, X)/ vn. (5.2.10) 


定理 5.2.3 在 定理 5.21 的 假设 条 件 下 ， 假 定 (T,X) 均值 为 震 ， 且 存在 原 
虞 的 邻 域 U， 和 常数 c>0， 对 任意 ueEU ， 


[E(o.(T, X)|T =t +u) — Blgi(T, X)|T =t) < clulat A tt oR. 
则 在 备 择 假设 式 (5.2.10) F, RR 依 分 布 收敛 到 Rog, KL 
g1s(t, x) 
= B{lou(T,X) - B(oi(T,X)|T)}w(T)U(T < t,x <2)} 
~E{U(L, XY (T,X) - Elg: (T, X)|T) w(T)}S 
xB{U(T, X)w(T)I(T <t,X < z)} 
是 非 随机 漂移 函数 ， 那 么 CV 依 分 布 收敛 到 [(B(T,X) + 91.(T, X))2d F(T, X). 
根据 one 的 表达 式 ， 只 有 (T,X) = BOX 时 ， g(t,z) = 0. Alt, CVn 可 以 


检测 到 以 1? 的 速度 融 近 原 假设 的 局 部 备 择 假设 根据 附录 中 定理 的 证 明 ， 不 
难看 出 检验 对 所 有 全 局 备 择 假设 相合 . 


5.3 NMCT jit 
记 
A(T, X,Y, t,x, 8) =ew(T)I(T <t,X < 1), 


R(T, X,Y, t, 2, U, S) = ew?(T)E[U(T, XY w(T)I(T < t, X < x)|S—1U(T, X), 
I(T, X,Y,t, 2,8, Fxyr) = ew(T)F(X|T)I(T < t), 
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则 


I(T, X,Y, t, x, 8, U, S, Fxir) 
= dSi(T,X,Y,t,2) — Jo(T, X,Y,U,S,t,2) — Js(T, X,Y, 8, F(X|T),t, £). 


根据 定理 5.2.2 ， 下 式 渐 近 成 立 : 


sa 
R,(t,2) = JE 2 Mts 2j, Y P,U, S, Fasty bo), 
j=1 


因此 考虑 第 1.2.3 节 的 NMCT iB BR FASS A. PE pT A A 
mF: 

ERL 产生 均值 为 零 ， 方 差 为 1 的 独立 随机 变量 ei(i = 1,---,n). 记 En := 
(el,… ,en) ， 定 义 相应 Rn 的 条 件 表达 式 


1< sie od 
R,(En, t,t) = F Latt y BOS, Pr, tz,) (5.3.1) 
j=l 


HH, 6, Ô, $, FSA RI) 中 B，U ，S 和 下 的 相合 估计 相应 的 
条 件 统计 量 为 


CVa(En) = J (Ra (En))?Fa(t,2). (5.3.2) 


HM 2 产生 m 组 En, DAA EPE = 1,… ,m) ， 相 应 地 得 到 m 个 
CVa(En) ， 记 为 CVa(E®),i =1,-+»,m. 

步骤 3 pHi hit p= k/(m+1), He, kR CV, (BO) 值 大 于 或 者 
等 于 CVn 值 的 个 数 ， 对 给 定 的 水 平 c ， 如 果 方 < a ， 拒 绝 原 假设 Ho. 

接 下 来 的 定理 说 明 NMCT 通 近 的 相合 性 . 

定理 5.3.1 在 原 假设 Ho 或 者 备 择 假设 Hi F, 假定 定理 5.2.1 的 条 件 成 立 ， 
对 几乎 所 有 序列 {t121 01) > (tn En Yn) }, Rn(En) 的 条 件 分 布依 分 布 收 
KE) Ry 在 原 假设 下 的 极限 分 布 . 

注释 5.3.1 本 章 中 用 CVa(En) 的 条 件 分 布 估计 检验 的 p 值 . 很 自然 ， RIA 
望 无 论 数据 来 自 原 假设 还 是 备 择 假设 ， 条 件 分 布 可 以 各 近 原 假设 下 检验 统计 量 的 
分 布 ,由 于 事先 并 不 知道 数据 的 分 布 ， 用 蒙特 卡 罗 通 近 得 到 在 备 择 假 设 下 的 条 件 分 
布 可 能 和 检验 在 原 假设 下 的 分 布 相 差 很 运 ， 如 果 情 况 属实 ，p 值 估计 不 准确 且 降 
低 检 验 的 功效 .然而 ,根据 定理 5.3.1 ， 基 于 NMCT 通 近 的 条 件 分 布 在 某 种 程度 
上 可 克服 上 述 问题 . 
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注释 5.3.2 根据 定理 5.2.1 可 以 解释 本 章 所 构造 的 检验 统计 量 为 什么 不 需 选 
择 标准 化 常数 .由 定理 5.2.1 ， 标 准 化 的 常数 等 于 


i< aap 2 
Cu = sup = D> (Isti y Â,Ù, S, Pes, bz)) ， 
3 j= 


LURR, HMA tar, TZ JT, X,Y, 8,U, S, Fxr:ts,) 的 样本 估计 的 上 确 界 . 
根据 式 (5.3.1), BR (titiy), Cn 恒 等 于 常数 ， 因此， 如 果 统 计量 中 含有 这 个 
标准 化 常数 ， 也 就 是 统计 量 为 CVa/Cr, ME RAFI RAMA CVa(En)/Cn. 
对 p 值 估计 而 言 ， 由 NMCT 通 近 得 到 CV, 和 CVa/Cn 的 了 值 估计 相等 ， 


5.4 数值 分 析 


5.4.1 ”模拟 研究 
在 本 节 的 模拟 分 析 中 ， 研 究 的 模型 为 


y = Ba + ba? + (t? — 1/3) + Vi2(t — 1/2)e, (5.4.1) 


其 中 ，t 是 [0,1] 上 的 均匀 分 布 ，z 和 e 是 随机 变量 ， 考 虑 四 种 不 同 组 合 的 zx 和 
e 的 分 布 ，@ Uni-Uni: x 和 都 是 [-0.5, 0.5] 上 的 均匀 分 布 ，@ Nor-Uni: 标准 正 
Bhi æ 和 仁 0.5, 0.5] 上 的 均匀 分 布 =;，@ Nor-Nor: x Al 均 为 标准 正太 分布; 
@ Uni-Nor: (—0.5, 0.5] 上 的 均匀 分 布 x 和 标准 正 态 分 布 e. 图 5.1 表示 四 种 不 同情 
况 所 得 到 的 经 验 功效 ， 在 模拟 中 8 = 1 ， 为 了 研究 检验 对 备 择 假设 的 敏感 性 ， 5 
的 取 值 为 6 = 0.0,0.5,1.0,1.5 和 2.0. b = 0.0 对 应 于 原 假设 ，5 关 0.0 对 应 于 备 择 
假设 ， 样 本 量 ”= 100 ， 给 定 水 平 a = 0.05. 实验 重复 3000 次 得 到 检验 的 功效 . 
核 函 数 选择 为 K(t) = (15/16)(1 — t?) I(t? < 1) ， 如 文献 Hirdle(1990) 和 Hardle 
和 Mammen (1993) 也 采用 了 相同 的 核 函 数 ， 如 何 选择 窗 宽 是 本 节 中 需要 考虑 的 问 
Æi. 文献 Fan 和 Li (1996) 并 没有 讨论 这 个 问题 . Gozalo 和 Linton (2001) 用 广 
义 交叉 验证 (GCV) 选择 窗 宽 ， 但 并 没有 讨论 这 个 方法 得 到 的 结果 如 何 ; Eubank 
和 Hart(1993) 给 出 的 结论 是 : 如 果 误 差 同 方差 ， 用 GCV 的 方法 可 以 选择 得 到 合 
理 的 窗 宽 ， 如 果 蜡 方差 ， 这 个 方法 不 一 定 得 到 合理 的 窗 宽 . 在 假设 检验 中 ， 如 何 选 
择 合适 的 窗 宽 这 一 问题 尚未 完全 解决 ， 它 超过 了 本 章 所 研究 的 范围 . 在 模拟 中 ， 首 
先 在 格子 点 上 搜索 使 得 GCV 最 小 的 值 ， 重 复 计算 1000 次 所 得 h 的 平均 值 ， 记 为 
hegev ; 然后 在 区 间 [hegev — 1, Regcv tl] 的 格子 点 上 搜索 使 GCV 最 小 值 的 点 ， 如 果 
误差 是 均匀 分 布 ， 计 算 之 后 得 到 的 h = 0.30 ; 如 果 是 正 态 分 布 ，h = 0.57. 在 原 假 
设 下 检验 的 功效 接近 给 定 的 水 平 0.05. 表 5.1 给 出 = 0.30 A h = 0.57 时 检验 的 
经 验 功效 . 
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表 5.1 统计 量 CV 的 经 验 功 效 (a = 0.05) 








b 0.00 0.50 1.00 1.50 2.00 
Uni-Uni 情况 h=0.30 0.0460 0.2350 0.4880 0.7940 0.9600 
hegev 0.0440 0.2370 0.4970 0.7950 0.9570 
Nor-Uni 情况 h = 0.30 0.0560 0.6500 0.9800 1.0000 1.0000 
hegev 0.0540 0.6200 0.9600 1.000 1.000 
Nor-Nor 情况 h=0.57 0.0450 0.3350 0.4410 0.5100 0.6040 
hegev 0.0450 0.3550 0.4440 0.5130 0.6060 
Uni-Nor 情况 h=0.57 0.0600 0.0700 0.1000 0.1900 0.2600 
hegev 0.057 0.0700 0.0800 0.1800 0.2300 


























(c) Nor-Nor 情况 (c) Uni-Nor 情况 


图 5.1 统计 量 的 经 验 功效 
LR: CVn 检验 ， 点 划 线 。 ADJ-FH 检验 ， +: ADJ-FL 检验 


下 面 考虑 与 Fan 和 Li(1996)(FL) 的 模拟 结果 作 比 较 . 由 于 FL 的 检验 包含 
关于 所 有 协 变量 (包括 t) 的 核 估计 ， 我 们 用 乘积 核 的 形式 ， 即 ， 它 的 每 个 因子 为 
K(t) = (15/16)(1-P)P(? < 1). 很 惊讶 的 结果 是 : 用 FL 统计 量 得 到 的 模拟 结果 基 
本 上 没有 功效 . 造成 这 个 结果 的 主要 原因 是 : 在 备 择 假设 下 , 方差 的 估计 很 大 ， 明 
显 地 降低 了 检验 的 功效 . 因此 ,我 们 用 原 假设 下 得 到 的 方差 估计 ， 调整 标准 化 常数 
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使 得 检验 保持 显著 性 水 平 . 经 验 功效 的 模拟 结果 见 图 5.1. 就 我 们 所 知道 的 而 言 , BR 
了 Fan 和 Li(1996) ， 没 有 其 他 文献 研究 部 分 线性 模型 的 检验 问题 . Fan 和 Huang 
(2001) 研究 了 在 误差 服从 Gaussian 分 布 时 ， 原 假设 是 参数 模型 的 检验 问题 ， 本 节 
也 包含 与 Fan 和 Huang (2001) 提出 的 适应 Neyman 检验 比较 结果 ， 统 计量 中 方差 
的 估计 也 是 通过 调整 得 到 . 

5.1 中 ， Adj-FL 和 Adj-FH 分 别 表示 用 调整 的 方差 估计 得 到 的 FL 检验 ， 
以 及 Fan 和 Huang 检验 的 结果 . 为 了 方便 比较 ， 所 有 的 功效 函数 见 图 5.1. 

从 图 5.1(a) ~ (d) 上 看 ， 如 果 z 服从 均匀 分 布 ， 由 CV 得 到 的 功效 比 Adj-FL 
和 Adj-FH 得 到 的 功效 者 好. 如 果 z 服从 正 态 分 布 ， 由 Adj-FH 得 到 的 功效 结果 最 
好 ， 见 图 5.1(b) 和 (c) ， 此 时 本 章 所 提出 的 检验 结果 最 差 .通过 调整 方差 估计 ， 在 
Nor-Uni 情况 下 Adj-FL 检验 对 备 择 假设 最 敏感 ， 对 本 节 所 研究 的 例子 ， 这 三 种 类 
型 的 检验 在 这 四 种 情况 没有 一 种 类 型 的 检验 在 任何 情况 都 最 好 






































` ww fas 
0 weg Si é 
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图 52 (a), (c) 和 (e) 分 别 表示 Y A X, Xo 以 及 BX 的 散 点 图 ， 其 中 是 6 DOR 

估计 ; (b), (d) 和 (f) 表示 用 线性 模型 拟 合 Y 和 X1, Y 和 Xz, 以 及 Y 和 (Xi, X2) 之 后 得 到 


RAA Xi, Xo 和 BX 的 残 差 图 
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5.4.2 ”实例 分 析 

本 节 所 研究 的 实际 数据 是 1965 年 1 月 到 1966 年 1 月 之 间 发 生 在 汤加 海沟 的 
43 次 地 震 的 深度 和 位 置 (Sykes, Isacks and Oliver, 1969). 变量 Xi 是 与 平行 汤加 
海沟 线 的 与 直 距离 ; 变量 X2 是 与 任意 垂直 汤加 海沟 线 的 距离 ; 响应 变量 Y 是 地 震 
的 深度 . 根据 板块 模式 , 地震 的 深度 随 着 远离 海沟 的 距离 增加 , 根据 散 点 图 5.2 也 
可 得 出 这 样 的 结论 . 本 节 的 目的 就 是 检验 变量 之 间 是 否 满足 线性 关系 . 从 图 5.2 中 
看 ，Y 和 X 之 间 有 明显 的 线性 关系 , 且 方 差 具有 异 方差 结构 ; 但 Y 和 X 之 间 没 
有 明显 的 关系 . 用 线性 模型 拟 合 Y 和 X 可 得 了 = -0.295 十 0.949X1 ， 经 检验 , 接 
受 原 假设 , 认为 它们 符合 线性 关系 . 但 拒绝 Y 和 Xo 之 间 是 线性 关系 这 一 假设 .如 
果 用 线性 模型 拟 合 响应 变量 Y 和 协 变量 X 和 Xo 之 间 的 关系 ， WY =X, X 
E X = (1,X1, X2)",B = (Bo, Êi, bo)”. MY AX 的 散 点 图 5.2(e) 看 ， 它 们 之 间 
有 这 样 的 线性 关系 . 图 5.2(f) 关于 残 差 和 BX 的 残 差 图 和 图 5.2(b) KF Y Al Xo 
的 散 点 图 类 似 ， 这 说 明 Xi 对 Y 的 影响 更 大 一 些 ， 然 而 ， 根 据 图 5.2(d), X2 at Y 





























X X 
©) 人 
图 5.3 (a) Y 和 Xz 的 散 点 图 ， (b) Xi 和 Xo 的 散 点 图 ， 以 及 Xo 和 ÊX |X) ( 实 线 表示 ) 
的 关系 图 (e) Xa AY — Go — BU 的 散 点 图 ，X2 和 ÊY ~ po -BU|X2)( 实 线 表 示 ) 的 关系 
图 (d) 用 部 分 线性 模型 了 = fo + BX. + 9(X2) 拟 合 数据 之 后 的 残 差 和 Xo 的 残 差 图 
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的 影响 不 能 忽略 .综合 上 述 讨论 ， 考 虑 用 更 复杂 的 模型 拟 合 响应 变量 Y 和 协 变量 
Xi, Xo 之 间 的 关系 . 
本 节 考虑 部 分 线性 模型 了 = Bo + 1X1 + g(X2) +e = bo +AU +r(X2) +e 
拟 合 数据 ， 其 中 U = X - E(Xi|X2), r(X2) = E(Xı|X2) + g(X2). 图 5.3 是 关 
于 数据 的 散 点 图 ， 根 据 图 5.3(b) ， EE(X1|X2) 是 Xo 的 非 线性 函数 ， 图 5.3(c) 说 明 
Y 一 bo 一 BU 是 Xo 的 非 线性 函数 ， 对 部 分 线性 模型 ， 根 据 残 差 图 5.3(d) 得 不 出 明 
显 的 关系 曲线 . 根据 本 章 所 提出 的 方法 检验 部 分 线性 模型 是 否 成 立 ,可 得 统计 基 值 
n = 0.009, 且 p 值 估计 为 0.90 , 则 接受 原 假设 , 即 响应 变量 Y 和 协 变量 (Xi, X2) 
之 间 可 以 用 部 分 线性 模型 拟 合 . 


5.5 定理 的 证 明 


5.5.1 ”假设 条 件 

定理 的 证 明 需 要 以 下 假定 条 件 : 

(1) i E(VIT =t) hE EOY] =t), 假定 LOT =t), B(XIT = 
t) ， 以 及 给 定 T=t，XX 的 条 件 分 布 函数 F(zlt) 满足 条 件 ， 存 在 原点 的 邻 域 ， 不 
妨 记 为 U 和 常数 c >0， 对 任意 ueU 和 所 有 t 和 z， 有 


|E(X|T =t+u)—E(X|T=2t)] < clul; 
JEM (YT =t+u)-B%M(Y|T=1] < clul; 
< 


|F(alt +u) — F(a|t)| < clul. (5.5.1) 


(2) EY |t < oo 和 B|X|* < 00. 
(3) 连续 核 函 数 KC) 有 以 下 性 质 : 
1) K(-) 的 支 集 为 区 间 [—1, 1]; 
2) K(-) 关于 0 点 对 称 ; 
3) f}, K(u)du = 1, 以 及 f? lulK(u)du # 0; 
(4) 4 n —> oo 时 ， „nh? 一 0, 以 及 Vnh 一 o; 
(5) 存在 cl ， 对 所 有 上 和 z ， ET =t, X =z) < cl RY; 
(6) 权重 函数 w(.) 在 支 集 [a,b] 上 有 界 连 续 (-co < a <b < co) ,密度 函数 SO) 
是 大 于 某 个 正 数 的 有 界 函 数 . 
注释 5.5.1 关于 上 述 条 件 ， 条 件 (1) 和 (3) 是 关于 非 参数 估计 收敛 速度 的 常 
用 条 件 . 条件 (2) 是 最 小 二 乘 估计 渐 近 正 态 性 的 必要 条 件 . 条 件 (4) 保证 了 检验 统 
计量 的 相合 性 . 条件 (6) 避免 了 非 参 数 光 浓 带 来 的 边界 效应 . 
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5.5.2 ”第 5.2 节 定 理 的 证 明 


定理 5.2.1 的 证 明 由 于 AY |e) 和 ÊX lt) 的 收敛 性 在 文献 中 已 有 证 明 , .只 
需 对 Stone (1982) 的 证 明 ， 或 者 Zhu 和 Fang (1996) 的 证 明 稍 做 修改 ， 可 得 


max, |E(Y|T = ti) — E(Y |T = ti)| = op(1/Vnh + h), 


max |Ê;(X|T = t;) — E(X|T = ti)| = op(1/Vnh + h). (5.5.2) 


ast; <b 


其 中 ， “| RZ Euclidean 范 数 . 关于 Å HWM, ALE V(t, vj) = wy — ÊY IT = 
tj) = B'U (tj, 3) + (uj — B'zj) — (BY - 8'X)T =t;), 有 


B= B+ SL D0, aNu P's) = (BlY PXT = 4))u*(t). 
j=1 


联合 式 (5.5.2) ,可 得 $ 依 概 率 收敛 到 S. 接 下 来 只 需 证 明 , 在 已 知 条 件 下 ， 下 式 成 
立 : 


T D Ü lti, zj) — 6x5) — (By (¥ — PX)T = t;))w? (ty) 
三 te LUi zts + oo Gam +h yny¥?). (5.5.3) 
也 就 是 证 明 以 下 三 个 表达 式 成 立 : 
n= lad (Olts,23) - U(t.23)) 
x (BV -PXT = ty) = EY -PAT = t))w%(t5)| 
= op(1/(Vaih) + Vnh?)!/?, 
n= lz Dz) BW = PXT = ty) - EY PXT = t,)) wt) 
j=l 
= op(1/(Vnh) +h) 
和 
r= z DO Xs) -Ulti X — 8'z;) — E((Y — 8'X)IT = t;))w°(t,)| 
j=1 


= op(1/(Vnh) + h). 
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在 以 下 证 明 中 , 不 妨 假定 X 是 一 维 变 量 . 由 于 Elex, T) = 0 (Y-p'X)-E((Y- 
PX)IT)=e, Iii, 


|E((O 6,23) = Ulty ale) (Olt 2) -Utz ws)e))| =0 
根据 第 5.5.1 节 已 知 条 件 (5) 和 (6), 


E(r3) < a E(Û (Ti, X1) — U (Tı, Xi)? = cB{(B (XD) - E(X T))?} 
= O(1/(nh) + h?). 


因此 ，r3 以 op((nh) 712 +h) 的 速度 依 概 率 收敛 到 零 . W ĝi = 应 [Y 一 8X)IT = ti). 
HE Y -pX =g(T) +e RRBF T Ale, HAE Ts M XG+), UTX) 
的 条 件 期 望 等 于 零 ， 又 因为 给 定 卫 ， UT, X) 的 条 件 期 望 为 零 ， 则 

[ELU (Ti, X) (âi — 9) w? (ts) (U (Lj, X — g)w(t))]| =0 (天 让. 
类 似 于 rs 的 收敛 性 质 的 证 明 ， 有 


E(r3) < BEIU2(T,X)G(T) — gT)’ wT) 
< supl(9(t) — 9(¢))?w?(t)]E[U(T, Xw?) 
= O(1/(nh) + h?). (5.5.4) 


因此 r2 = op(1/Vnh + h). 接 下 来 证 明 当 n TER, r 趋 于 零 . 根据 Cauchy 
不 等 式 ， 以 及 


sup |(O(ts2) — U (ti, x) w(t;)| 


= sup |(Ê:(X lt; )) = E(X ts) w(ts)| = op(1/(Vnh) + h), 


可 得 





j=1 


op(1/(vnh) + Vnh?). 


ae teva} LSO, z4) — U(t;,23))2w2(t;) x e Sette) 


根据 第 5.5.1 节 条 件 (4) ， 定 理 证 毕 . 
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定理 5.2.2 的 证 明 根据 定理 5.2.1 的 结论 ， 通 过 一 些 初 等 计算 ， 有 


i£ 
R(t, z) = = jw(t; I(t; < t, £j < 7) 
GE A ts I(t; Tj ST 
-E(U(T,X)w(T)I(T <t,X < msn YU (tj, 25 )ejw?(ts) 
vn 
-FEW <ta <a) 
j=1 
+e DIEI <t <2) + op (z + vae) ”) 
j=1 


=: (t,x) — h(t, z) ~ I(t, 2) + Ialt, 2) + op( (z + van?) ™?). 


GA 

根据 经 验 过 程 的 理论 可 得 五 和 五 的 收敛 性 ， 见 文献 Pollard (1984, 第 7 3). F 

面 证 明 五 -五 依 分 布 收 敛 到 Gaussian 过 程 . 先 简化 五 W ilti) =n! (yj 一 
Jj#i 

B'zj)kh(ti — tj). 通过 一 些 初等 计算 ， 根 据 式 (5.5.2), Hasti sb, 

filt) _ Filt) , r(ts) Fs) 一 Silt) 


fit) Fl) *FG) TO) 
4 thts) (Fs) 一 f(t)?  Filts) — r(t) Flt) 一 Fitts) 





S(t;) = 








Sti) f(t) f(b) Ft) Silty) 
= filts) , f(tj) 一 f(s) 1 2 
= FG) + g(t;) TE) + op( 大 十 人 2)， 


其 中 ， 9 的 ) = r(ts)/F (ts). 所 以 ， 





+t we <t, zj 7)+ olr a + Vnh?). 


=: Igi (t,x) — 132(t, £) + Isa(t, £) + (77 i + Vnh?). 
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现在 把 131(t,z) GRU 统计 基 的 形式 . 记 w(t) = w(t)/f(), UR 


Un(ti, Zi, Yas ty, Tj, Yjit, T) 
= [@ = Pw) ) TG < bry <2) + (y = Bx (tI < tz < a)] 
kn (ti — tj). 


根据 bn () 的 对 称 性 ， 对 固定 的 h(ie. 固定 n), 
Ai = zay DD DAU trusts. tj yt a). 
jal ig 
为 了 记号 上 的 方便 ， 记 ny = (ty, zj yj). 定义 退化 U 统计 量 
wes >» > Ty. (mi, mj, t, £) 


j=1 ifj 
=: 4 hla(t.2) ~ E(h I(t, 2)) 


EY {Bhan n; t,2)] ~ BUT. X,Y; Ti, Xi, Yust,))} 
m2 


HH, “BRAM ARERR, “E 表示 给 定 n; ， 对 n RREA. hF 
Ex (Igı(n, m, t,2)) = Ex (Hi(m, ,tz)) =0, 由 hUr(, t,£) — EilhUs(n, n; t,£) 
关于 所 有 + 上 和 z 组 成 的 函数 族 9 是 VC 函数 族 . 因此 ， Ga 为 P BAER, Hik 
为 


Gn(m: m) 
= |[w — Sx, )ury (to) + (yo — B’x2)wr (ti)] k(t — t2)/h)| 
+2|B[04 ~ 6'Xi)un (Ta) + (Va ~ B Xa) (T| ECT: — 72)/h)| 
HELO — 6X1 )wa (te) + (vo ~ Pza)w (T1)] ICT: — t2)/h)| 
根据 Nolan 和 Pollard (1987) 第 786 页 的 定理 6 ， 


Esup| X La (m1, t,o) < cE(on + YnJn(On/Yn))/n-2?2, 
Pid. 


其 中 ， 
In(s) = f log Nalu, Tn, Gn: Gn)au, 
0 
Yn = (TaG2)"?, an = + sup (Tag?)?. 
4 9G, 


(5.5.5) 
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对 任意 函数 9 ， 


Tag? := JO 9 (mi my) + 9° (Mmi M251) +9°(Mmi-1: M) + 9? (mai1, 125-1) 
ižj 


No(s Tn: Gn: Gn) 表示 在 测度 Tr , UE Gr, UR Lo 距离 下 的 覆盖 数 . 由 于 Ga 
为 VC 族 ， 类 似 于 Pollard (1984, 27 页 ) 的 逼近 引 理 I 的 证 明 过 程 ， 可 得 存在 独立 
于 Al Tr 的 正 数 c 和 w, HR Na(u(TnG%)/n?,Tn/n?,9n,Gn) 小 于 或 者 等 于 
au, JAHH EEKE n, FRERES: 


TrG? = O(hn?log?n) a.s. 


因此 ， 对 足够 大 的 n, WREE c > 0187 h =n RE, 则 TG2Jn?<1, 且 
Nolu, Ta/n?, Gn, Gn) < cu ,注意 到 


Nolu, Tn, Gn, Gn) = No(u/n?, Ta /n?, Gn, Gn), 
经 过 推导 ， 可 得 
Jn(8n/%n) < Jn(1/4) 
1/(4n?) 
=n? [og Nalu Ta/n?, Gi, G)du 
0 


1/(4n?) 
= -o | logudu = clogn 
0 


2 = TnaG? = O(hn? log? n) a.s. 


BRA, HEEK n, Esup,.| D (m nt, s)| <eVh/nlogn. 等 价 地 ， 
a? 
Iz (t,£) = 去 Le (nln; nj; t, 2)]} + op (log n/V nh). (5.5.6) 


根据 (n/(n — 1) E(t, 2) = Vn/2E(Ur(m mit.) , A 


I3)(t,2) = woe [Vren m;t, zj] 





saini mit,a)| 十 op (sz) 3 (5.5.7) 
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由 Un 的 定义 ， 条 件 (1) ， 以 及 一 些 初等 计算 ， 可 得 


E|Un(m m;t, 2)] 
= 2E [9(Tiu (T)I(T < t, X < ain(n — T)] 
= 2Elg(T + hu) f(T + hu)wi(T)I(T < t, X < x)K(u)] 
= 2E[g(T)w(T)I(T < t, X < 7)] + O(h?) (5.5.8) 


EUr(m nj; t, 2) 
= wilt; I(t; < t,£; < 2) [ ohut) f(t tK) 


+(yj — PB'z;) / F(zIT)F(T) (THIT < t)K((T — t;)/h)/ha T 
= a\(t, x) + a(t, 2), 


其 中 ， F(X|T) 是 给 定 全 时 X 的 条 件 分 布 . 
记 


BP (tz) = ISl < t,t; <2), 
oP t, 2) = (yj — Bas) F (alts) f(ts)wr (tilt < t). (5.5.9) 


根据 条 件 (1)~(4) 和 (6) ， 

sup Ela (t, Z) 一 w(t, z))? = O(h?), 

sup E(a®(t, 2) — b(t, z))? = O(h?). (5.5.10) 
注意 到 w(t) = w(t)/f(t) ， 则 


EM (t,2)) = EOP (t, 1)) = Elg(t)w(T)I(T < t, X < o)), 
E(a§ (t,2) + aP (t, 2)) = 已 [DCT X,Y; Ti, Xi Yi;tz)]. (5.5.11) 


记 oj(t,z) = (af (t2) +a (t, 2) -oP (t, 2) —0(t,2)) ， 接 下 来 证 明 下 式 关于 和 
z 一 致 成 立 : 


z Soe x) — Ec;(t,x)) = op(h!/? logn + h? Vn). (5.5.12) 
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由 于 
sup Var(e;(t,2)) < sup E(cĝ(t, 7)) 
< 2sup E[(aP (t,2) -bP (t, 2))? + (a (2) -bP 2))°] 
< OU2)， 
又 因为 指标 集 为 (bz) 的 所 有 函数 cj(bz) = eltt yta) 组 成 的 函数 族 依 多 项 
式 的 速度 可 识别 有 限 个 点 ， 也 就 是 ， 函 数 族 属于 VC 族 ， 见 Gaenssler (1983). 用 对 


称 化 的 方法 和 Hoeffding 不 等 式 ， 见 文献 Pollard (1984, p14~16) ， 对 任意 5 > 0 ， 
存在 w>0， 


Plow 7 D6 (647) ~ Ecj(t,z)) > ô} 


< 4B{P{sup ZY 04 ty2) ~ Bes(t,2)) > AT X,Y),1 = 1 sn} 


2 
< E{(cn” sup exp teen MO ed Al}. 
tx 


322 D (c(t, 2) — Ec; (t, 2)? 


j=l 


根据 条件 (1) 和 一 致 强大 数 定理 ， 见 Pollard (1984, p25, 第 2 章 定理 24) , 
sp 可 一 Bot 可 = 全) 
Pn dy 


如 果 5 的 取 值 为 5 = 加 /2logn, 则 式 (5.5.12) 成 立 . 根据 式 (5.5.10), VE |i(t,2)] = 
Olah?) = O(1) ， 以 及 式 (5.5.9) 和 式 (5.5.12) ， 可 得 


Ja1(t, 7) = 天 DEP, 1) +005) — HolT)WITIUT < bX < 2) 
j=l 


tol +h) 
= I(t,2) + a YO (t,2) - Eg(Tw(T)UT <t, X <2) 


j=l 


+h). (5.5.13) 





1 
+ 
op ( Tai 
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J32(t,z) 与 Ia (t,x) 的 处 理 过 程 一 致 ， 可 以 证 明 


me 7) 
Fg Loet) I(t; < t,£; <2) 


vO iat 


+e 5 (a(t, yu) F(a (ty <t) — Elo(T)Y TT <t, X < a)]) 
j=l 





Fosi 5 +h) 
= Igg(t, x) 


+ Fa (WEDE <0- Bl <x <2) 


(5.5.14) 





tol +h) 
由 I3(t,z) 的 表达 式 ， 式 (5.5.13) 和 式 (5.5.14) , 





Riz) —Is(t,2) = Fa LUPE <t) ta +h). (5.5.15) 
j=l 


显然 上 式 依 分 布 收敛 到 中 心 化 的 Gaussian 过 程 ， 定 理 证 毕 . 
定理 5.2.3. 的 证 明 根据 定理 5.2.1 的 结论 ， 有 


Jala — 9) = 878 L SUl, zesu?) $ +01 + ol), 
n( ) > tjr Tj JE GW »| 1 + Op 


其 中 ，C =S EU(T, X) (T, X) — Elg (T, X)|T)w?(T)). 类 似 于 在 原 假 设 下 的 
证 明 ， 经 过 计算 可 得 
Rn lt, £) 


1 
“5 Vejwlts M(t < t,zj <2) 
j=l 


-E(U(T, X)w(T)MT < t,X < DS LU Jejw(ty) +C] 





x DO) -IUG < bay < +o oat vit?) 
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Pot, 23) ~ Elg (T, X)IT =) wits Mts < tay <2) 
名 


n 


FLuto) I(t; < t,£; < z) 


n 


-E(U(T, X\'w(T)I(T <t, X < 2))S FLU (tj zi)esw? (ti)] 


a? Dats) -DUG <2) <2) 





+9ix(t, x )+ On re + Vnh?) 


=: Jı(t, £) — Ja(t,2) — Ja(t, 2) + gre(t,2) tol +vnh?)/?), (5.5.16) 


其 中 ， g(t.) 的 定义 见 定理 5.2.3. 记 立 = BX+g(T)+e， g(t) = EÝ - 
BXIT = t) ， 及 其 在 点 ti WAH ĝolti) = ÊY - BXIT = 如 显然 gb) = 
ga(ti) + Ela (T, X)|T = ti)/Vn, Ot) = Go(ti) + Ei(gi(T, X)IT = ti)/Vn. 又 因为 
4 n> oœ ff, sup; |Ei(g (T, X)|T = ti) — Elg (T, X)|T = ti)| > 0 依 概率 成 立 . 
所 以 


(7 


= F Let- galt;))w(t;)U(ty < bz; <2) 
a 


+D [BT OIT =t) - Bul, XIT = ewe IN; < tas <2) 
j=l 


=D [9266) ~ galt) wt, (ty < bn; <2) + op(1) 
vary 


因此 ， Js HEEF 13(t,z) 一 Ja(t,z) , di Al Jo DIERFE 5.2.2 HH h Al be. 
根据 定理 5.2.2 的 证 明 过 程 ， 得 到 该 定理 的 结论 .证 毕 . 


5.5.3 第 5.3 节 定 理 的 证 明 


定理 5.3.1 的 证 明 根据 Wald 理论 ， 只 需 证 明 ， 对 几乎 所 有 序列 {(t1, tny) 
(try Znyyn),…} ，@ Rn(En) 的 协 方差 函数 收敛 到 R 的 协 方差 函数 ，@ 对 任意 有 
限 指标 (5,zi)，… (te, te), Rn(En) 的 有 限 分 布 收敛 ，@ Ra(En) 一 致 紧 ， 即使 
在 局 部 备 择 假设 下 ， 记 Û, $H P(X|T) 分 别 是 b, U, S 和 F(XIT) 的 相合 估计 ， 
所 以 很 容易 验证 性 质 @ 和 @ 成 立 ， 具 体 细 节 不 再 痪 述 ， 接 下 来 证 明 性 质 @ 成 立 . 
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由 指标 集 是 (t, z) 的 所 有 函数 J( t, 1) 组 成 的 函数 族 是 VC 族 . 给 定 {(th,21,"1) °°, 
(tnn: Yn)} ， 定 义 L?(Pn) 半 范 dn((t, 8), (t, 3')) = (Pa(J(T, X,Y, t,8) — I(T, X,Y, 
t',5'))?)/?, FEH Pr 是 经 验 测度 , 对 (T, X,Y) 的 任意 函数 f(-) Pa f(T, X,Y) 表 
示 f(T, Xa, Ya), ,FT Xn, Yn) Kn 个 值 的 平均 数 . 关于 一 致 紧 的 证 明 ， 只 需 
证 明 本 度 连续 引 理 成 立 ， 见 Pollard (1984, p150). 根据 Pollard (1984, p157) 的 定理 
VII21， Rn(En) 依 分 布 收敛 到 Gaussian 过 程 R. 也 就 是 ， 对 任意 ”>0 和 > 0, 
存在 5> 0 满足 


lim sup P{sup |Rn(En,t, 8) ~ Rn(Enst,s)| > n|Tn, Xn, Yn} <6 (5.5.17) 
noo 6} 


其 中 ， [6] = {((t,8), (t, 8”) : dn((t, 8), (t's) < ô}, (Ta, Xn, Yn) = {tn 21, yi) 5 
(tn Tn, Yn)}- 

由 于 我 们 所 关心 的 是 n 一 co 时 变量 的 极限 性 质 ， 为 了 简化 证 明 过 程 ， 以 下 总 
BE n BK. (ts) 表示 7(,t,s) 中 未 知 量 取 真 值 ， 记 9 = {7(,t,s) :te 
RÌ, s € RY} 和 d((t, s), (t, s’)) = [Pa(J' (T, X,Y, t, 8) — J'(T, X,Y, t', 8!))?}/2. 根据 估 
计 的 相合 性 ， SuPs), ldall, s), #8) — d((t, 8), (ts)| 一 0 依 概率 成 立 ， 因 
此 ， 对 足够 大 的 n, 


P{sup |Rn(En,t, 8) — Ra(En,t’, 8’)| > nTa, Xn, Yn} 
<P{ sup |Rn(En,t, 8) 一 Ra (En, t’, 8’)! > nTn, Xn, Yn} (5.5.18) 
<25> 
这 里 25 >= {(t, s) : d(t, s) < 26}. 


为 了 用 链 引 理 (Pollard (1984, p144)) 的 结论 ， 只 需 验证 下 述 两 个 条 件 是 否 成 
X, Bh: 





P{|Rn(En,t, 8) — Rn(En,t', s)| > nd((t, s), (t', 8'))|Tn, Xn, Yn} 
< 2exp(—1?/2), (5.5.19) 


以 及 存在 5 > 0 ， 使 得 下 式 有 限 
(6,d,9) = f * (2log{ (alu, d, 6))?/u}} "du. (6.5.20) 
0 


其 中 , 覆盖 数 Nolu, d, G) 的 定义 为 : 存在 mA, 对 任意 (t, s) , 有 mini<icm d((t, 8), 
人, s)) < u，, 使 得 不 等 式 成 立 的 最 小 整数 m 就 是 覆盖 数 . 根据 Hoeffding FER, 
A (5.5.19) 成 立 . 由 于 9 属于 VC 族 , 且 存 在 常数 c 和 ww, 满足 No(u,d,G) < cu”, 
则 式 (5.5.20) 成 立 . 根据 链 引 理 ， 以 及 Jo(5,d,G) < cul/? 对 某 些 c > 0 成立, 存在 
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< 26 > 的 可 数 稠密 子 集 < 25 >* ， 满 足 
P{ sup, Vn|Rn(En;t, 8) — Rn(En,t’,s’)| > 26cd"/?|Tn, Xn, Yn} 
<26>* 
< 26. (5.5.21) 
由 于 Rn(En,t, 8) — Rn(En,t’, 8’) 关于 t 和 s 右 连续 ， 可 数 稠密 子 集 < 25 >* 可 用 
< 25 > 本 身 代 蔡 ， 联 合式 (5.5.18) ， 只 要 选择 足够 小 的 5 ， 就 可 以 得 到 定理 的 结 
论 . 证 毕 . 
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对 响应 向 其 了 = (y1, ya)" 和 协 变 基 X = (z1,… , zp) ， 其 中 代表 示 和 矩阵 
的 转 置 .假定 Y 可 以 分 解 成 和 的 函数 向 量 m(X) = (ma(X) ,me(X))T 以 及 和 
X 正 交 的 误差 向 量 s 之 和 ， 即 给 定 X ， e 的 条 件 期 望 B(e|X) = 0. 在 实际 情况 
中 , 关于 m 的 统计 推断 很 重要 .如果 ma) 为 参数 结构 ， 它 完全 由 未 知 参数 确定 ， 
例如 ， 对 线性 回归 ， m(z) = BT x, EP 8 = (B, ,By) 是 p x q 的 未 知 矩阵 ， 
它 的 估计 依赖 于 具体 数据 ， 对 m(z) ， 考 虑 更 一 般 的 非 线 性 结构 m(z) = (6,2) = 
(HBT) Dalba T)", KERR DC) 可 能 是 非 线性 的 ， 但 函数 本 身 是 确 

正如 第 4 和 第 5 章 所 讨论 的 , 在 回归 分 析 中 , 为 了 避免 由 事先 假定 的 参数 模型 
得 出 错误 结论 , 首先 应 该 对 数据 是 否 符合 这 类 模型 做 检验 .目前 对 参数 模型 的 拟 合 
优 度 检 验 是 统计 分 析 中 的 重要 问题 之 一 如果 响 应 变 其 是 一 维 的 ,也 就 是 g = 1 ， 
此 类 参数 检验 问题 在 第 4 和 第 5 章 已 经 做 了 相关 研究 . 

第 4 和 第 5 章 的 研究 结果 都 是 基于 响应 变 基 是 一 维 的 情况 .原则 上 ， 通 过 对 
一 维 响应 变量 中 所 使 用 的 方法 做 一 些 修改 ， 也 可 以 处 理 多 维 参数 回归 模型 的 检验 
问题 . 然而 ,在 响应 变 基 是 多 维 的 情况 ,构造 统计 其 时 应 该 考虑 响应 变 基 元 素 之 间 
的 相关 性 . 任何 现 有 检验 方法 的 直接 推广 很 难得 到 功效 较 好 的 检验 . 如 何在 多 维 响 
应 变量 的 情况 下 构造 统计 其 ， 是 本 章 研究 的 问题 之 一 . 

对 本 章 研究 的 检验 问题 , 构造 得 分 类 型 的 统计 其 , 且 给 出 了 检验 的 渐 近 性 质 . 
为 了 增强 检验 的 功效 ， 本 章 讨论 了 统计 量 中 权重 函数 的 最 优选 择 . 

本 章 另 外 一 个 关心 的 问题 是 如 何 确定 p AA. 如 果 用 统计 基 的 渐 近 分 布 确定 ， 
在 样本 比较 小 时 ， 所 得 到 的 结果 可 能 不 好 . 在 文献 中 ， 已 经 有 很 多 关于 用 蒙特 卡 罗 
逼近 原 假设 下 统计 量 分 布 的 研究 ， 如 著名 的 自助 法 (Efron, 1979). 现 有 的 研究 方法 
是 针对 参数 (如 参数 自助 法 ， Beran and Ducharme, 1991) 或 者 完全 非 参数 分 布 . 
正如 第 2 章 所 研究 的 ， 很 多 常用 的 分 布 具有 半 参 数 结构 .如 果 协 变量 或 者 误差 的 
分 布 是 半 参 数 结构 ,应 该 考虑 用 半 参 数 方法 逼近 检验 在 原 假设 下 的 分 布 , 而 不 是 简 
单 地 把 它 看 作 完全 非 参 数 分 布 ， 因此， 本 章 用 第 2 章 所 提出 的 NMCT 方法 估计 检 
验 的 p 值 ,而且 如 果 分 布 结构 未 知 ， 用 第 1 章 ， 第 1.2.3 节 中 所 提出 的 NMCT 方 
法 也 可 以 允 近 统计 革 的 分 布 ， 此 逼近 法 的 相合 性 证 明 在 下 文 给 出 . 

对 本 章 构造 的 得 分 类 型 检验 ， 包 含 统计 基 Te 的 协 方差 矩阵 极限 的 估计 . 这 是 
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为 ,如果 不 包含 这 个 估计 ， 原 假设 下 的 极限 分 布 不 是 卡 方 分 布 ， 这 说 明 检验 不 是 
刻度 不 变 的 . 然而 ,在 一 般 情 况 下 , 备 择 假设 下 得 到 的 这 个 矩阵 的 估计 比 原 假设 下 
的 估计 大 , 此 时 可 能 会 降低 检验 的 功效 . 但 是 很 难 选择 不 受 备 择 假设 影响 的 估计 . 
有 趣 的 是 。 NMCT 方法 完全 避免 了 这 个 问题 ， 统 计量 中 并 不 需要 含有 Th 协 方差 
和 矩阵， 这 无 疑 可 以 增加 检验 的 功效 . 

NMCT 方法 可 以 很 容易 地 应 用 到 传统 的 多 元 线性 模型 检验 中 ， 比 如 研究 哪个 
协 变量 对 响应 变量 的 影响 不 大 ， 教 科 书 上 常用 的 标准 检验 是 被 称 为 Wilks lambda 
的 似 然 比 检验 ， 通 过 卡 方 分 布 确定 p 值 ， 见 文献 Johnson 和 Wichern (1992). 在 误 
差 的 分 布 是 正 态 分 布 的 前 提 下 ， Wilks lambda 统计 车 被 证 明 是 很 有 效 的 .然而 ， 
如 果 不 满足 正 态 分布 ， 这 个 结论 并 不 正确 ， 本 章 用 NMCT 法 逼近 统计 量 分 布 , 通 
过 理论 和 模拟 说 明 NMCT 法 有 很 好 的 逼近 效果 .在 数值 模拟 中 ， 即 使 误差 为 正 态 
分 布 ， 由 NMCT 法 得 到 的 功效 比 由 Wilks lambda 得 到 的 功效 好 . 
本 章 的 大 部 分 内 容 来 自 文献 Zhu 和 Zhu (2005). 














6.2 检验 统计 量 及 其 渐 近 性 
6.2.1 得 分 类 型 的 检验 
假定 {(21,91),°** , (zn,yn)} 是 来 自 总 体 分 布 的 样本 ， 满 足 模型 
Y =m(X) +e, (6.2.1) 

FP, e= (e1,… eq)” 为 独立 于 X 的 4 维 误差 向 量 ， 本章 研究 的 检验 问题 为 ， 
在 原 假设 下 ， 存 在 矩阵 B = (A1,--- , Ba) 人 ， 

Ho: m(-) = 9(8,-), (6.2.2) 
也 就 是 ， 对 任意 i (1 < i< g) ，mi(-) = 9i(Bi,-). 备 择 假设 为 ， 对 任意 6 

Hy: m() # §(8,). 


记 e=Y 一 6$(5,X)， 在原 假 设 Ho F, e=e, H E(e|X) =0. 对 XX 的 任意 4g 维权 

重 函 数 W(8,.) ， Ele.W(8,X)) = 0， 其 中 “. ”表示 向 量 的 各 个 分 基 分 别 乘积 . 

基于 这 个 结论 ， 通 过 T= Ele- 本 (8,X)) 的 经 验 形式 定义 得 分 类 型 的 检验 ， 记 
HES a. W(6,2;), (6.2.3) 


其 中 ，6; = yj- O(G,2;), BEG 的 估计 定义 统计 量 TT = nTT 人 -17,, 这 里 
“T” 表示 转 置 ， 人 是 协 方差 矩阵 Ta 的 相合 估计 . 
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如 何 估计 检验 中 的 将 在 后 文 给 出 ,权重 函数 W(B,-) 的 选择 非常 重要 ,合适 
的 权重 函数 可 以 使 检验 的 功效 很 好 ， 否 则 可 能 会 使 功效 很 差 . 比如， 在 模型 是 线性 
的 情况 ， 6 的 估计 户 是 最 小 二 乘 估 计 ， 如 果 权 重 函 数 W(z) = > ， 因 为 残 差 ê 和 
zj 正 交 ， 此 时 检验 没有 功效 ， 在 6.3 节 ， 我 们 将 重新 讨论 这 个 问题 . 


6.2.2 “” 渐 近 性 和 功效 研究 


p 的 估计 通过 最 小 二 乘法 得 到 ， 也 就 是 下 述 和 式 关 于 8 的 最 大 值 记 为 的 估 
Hô, 


Yow; - 2(8, z;))T (u; - (3,23). 
了 1 
显然 ， 语 的 每 列 元 素 房 ( = 1,--- ,9g) 是 


DUP - pi(Bi, 2s) To? — 6:61.25) 
j=l 


关于 bi 的 最 大 值 . 
在 一 些 正则 化 条 件 下 ， Â 是 以 下 方程 组 的 解 : 
E Bi TUP — bilBi, z) =0. (6.2.4) 
j=1 


IH, JE ORF A 的 导数 得 到 的 p 维 向 量 ， 不 难得 到 房 的 渐 近 线性 表达 式 . 
对 模型 式 (6.2.1), yf? = mi(z;) + (GF = 1,---,n). En = B(B,X) - m(X) , 
ng = B(B,27) 一 m(z;) ， 则 器,… ,mn Æ iid. 随机 变量 ， 房 的 渐 近 线性 表达 式 为 


4 i< ),1< , i 
Êi = Bi = SUS GBs ase? + = D> Sa HB Df? + op(1/ Vi) 
j=l 


j=l 


=: Bni + Cni + 0p(1/Vn) (6.2.5) 


其 中 ， Sni = A A ai) 关于 线性 表达 式 的 相关 工作 可 参考 


Stute, Xu 和 Zhu(2007). 

由 于 Bu = O(1/VA) 依 概率 成 立 ， 而 且 在 备 择 假设 下 ， Sw 和 Chi 分 别 满足 
Sni > Si = B (90i, XHB: XT) 和 Cu + Ci = S'E (48i, Xm), 所 以 
Be 收敛 到 Bi + Ci. 显然 Cy A 0, 对 应 于 备 择 假设 H. 下 面 分 别 研究 统计 量 在 原 假 
设 和 备 择 假设 下 的 渐 近 性 质 . 

接 下 来 的 定理 说 明 Th = (Tar, , Tag)? 的 渐 近 性 质 . 
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定理 6.2.1 假设 

(1) 6 关于 B 的 二 阶 导 数 和 WHO 关于 6B 的 一 阶 导数 连续 ， 且 有 界 于 函数 
M()(E(M(z))? < 00). 

(2) 9i, WO 和 e® 的 二 阶 距 有 限 . 

(3) 关于 户 的 渐 近 表达 式 (6.2.5) 成 立 ， 则 


5 ee j i a 
VaTai =: = DVM + SY VON +op(l), (6.2.6) 
Vn > i i wad 大 党 


其 中 ，TV = (WOB, 25) — EWO, X8: XS (H(B:.25))).- 


。 在原 假设 Ho F, Vani- Ti) 依 分 布 收效 到 NO, 0), ou AVM 的 方 
差 ， 则 Vi(Tn —T) 依 分 布 收敛 到 N(0, 了) ， 其 中 E= (obm)i<tmse ， 对 任意 
一 组 lm(1 <lm<q), om 是 Vj? 和 VME” 的 协 方差 ， 根 据 这 个 结 
$, Tn 是 自由 度 为 4 的 渐 近 卡 方 分 布 . 


。 在 各 择 假设 Hh F, RAK UL<i<g), Fr? EVO? -oo， 则 
jal 
TT 一 00 依 概率 成 立 ; 如 果 [m2 So VO] > SBR), RY Tai 依 分 布 收 
j=l 


BEIT; + Sj. 3% S = (S1, Sq)? ， 则 TTh 依 分 布 收敛 到 (T+ S)TOMT + 
5) ， 也 就 是 自由 度 为 g 的 ， 非 中 心 值 为 STD-1 的 卡 方 分 布 . 


根据 这 个 定理 , 检验 可 以 检测 到 依 n 的 速度 通 近 原 假设 的 备 择 假 设 . 接 下 
来 讨论 权重 函数 W 的 选择 . 
6.2.3 ”权重 函数 W 的 选择 

首先 考虑 g = 1 的 情况 ， (T+ S)TOMUT + S) 的 分 布 是 非 中 心 为 ST-S 
的 卡 方 分 布 ， 见 文献 Stute 和 Zhu (2005), Zhu 和 Cui(2005). 如 果 考 虑 单 边 检验 问 
题 ， 它 的 势 函 数 为 8( 一 ca/2 十 -1/25) + 有 (一 ca/2 一 呈 -125) ， 其 中 ca 是 正 态 分 
布 的 (1 一 a) 分 位 点 ,不 难 证 明 势 函数 是 |2-1/25| 的 单调 函数 . 对 多 维 响应 变量 的 
情况 ， 有 如 下 类 似 结果 . 

引 理 6.2.1 假定 定理 6.2.1 的 条 件 成 立 ， (T+S)TOMUL+S) PHHYR 
HA STIANS HP HR. 

根据 引 理 6.2.1 ， 如 果 要 使 检验 的 功效 最 好 ， 应 该 选择 使 Le =STI-15 最 
大 的 权重 函数 W. 

引 理 6.2.2 在 定理 6.2.1 的 条 件 下 ， W 的 最 优选 择 满足 方程 DPV = 
[EP n, HP [E (7?) 是 对 角 线 元 素 是 EnO) af, V=(VO,... ,VO)T， 
VO 的 定义 见 定理 6.2.1. 
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注释 6.2.1 引 理 6.2.2 给 出 如 何 通过 解 方程 的 办 法 寻找 最 优 权 重 画 数 ， 在 某 
些 特 殊 的 情况 , 可 以 给 出 解 的 表达 式 . RW 和 由 ER, 此 时 V FTW. RW 
的 分 量 相互 正 交 ，< 与 忆 独立 ， 且 它 的 所 有 分 量具 有 相同 的 方差 cz , MUA 
角 线 元 素 为 PEWO) tat AEH, SVV =o [E(W?) PW = [E)n 
由 于 oa2 RPK, KEDA W TRA n 根据 上 述 假定 得 到 的 权重 函数 和 我 们 直 
觉 上 选择 的 权重 函数 相 吻 合 ， 也 就 是 如 果 权 重 函数 W fon RO, 检验 的 功效 应 
该 较 好 ， 而 且 假 定 W 和 o 正 交 是 比较 合理 的 ， 因 为 偏离 原 假 设 模型 的 部 分 应 该 
在 由 p(B, X) 对 所 有 X 扩张 成 的 空间 的 正 交 空间 中 . OR G(BX)=X, RET 
数 应 该 与 由 X 组 成 的 线性 空间 正 交 ， 如 果 响 应 向 量 是 一 维 的 ， 类 似 的 讨论 见 Zhu 
和 Cui (2005) 以 及 Stute 和 Zhu (2005). 另 一 方面 ， 如 果 对 备 择 假设 知道 的 先 验 信 
息 比较 少 ，] 未 知 ， 甚 至 不 可 估 ， 此 时 ,就 不 能 用 这 种 选择 权重 的 方法 ， 在 实际 情 
况 中 可 以 通过 画 残 差 图 ,或 者 Y 和 的 散 点 图 来 选择 权重 函数 . 在 第 6.4 节 对 这 
种 通过 画图 的 方法 选择 权重 函数 做 更 详细 的 描述 . 


6.2.4 ”回归 参数 的 似 然 比 检验 


首先 回顾 一 下 传统 的 对 回归 函数 的 似 然 比 推断 问题 ， 此 方法 在 很 多 多 元 分 析 
教材 中 都 有 讲解 ， 如 Johnson 和 Wichern (1992). 考虑 线性 模型 


Y =fTX+e, (6.2.7) 
其 中 ，e 与 XX 独立 .检验 X 的 部 分 分 基 是 否 对 Y 有 影响 ， 即 在 原 假设 下 
Ho: Bay = 9, 


其 中 ， BT = (8E) AB) BL, 和 OE, SPILL a x LA x (p -的 矩阵 , ik a? = 
(CO, GO), CO) 和 GD) 分 别 是 ! 和 (p 一 /) 维 向 基 ， 在 原 假设 下 ， 横 
型 为 





Y=BE)X® +e. 


对 样本 {(z1, 妇 ),… , (zn,yn)} ， 根 据 最 小 二 乘 估计 ， 不 难 分 别 得 出 67 和 BE) 的 
估计 BT 和 BB). id 


n 
È = Dy -Prz)(y — 6725)"; 
j=1 
Sy = Sw = Bye? )(y; = Âp PT. 
j=l 


似 然 比 统 计 车 的 修正 ， 也 称 为 Wilks lambda 检验 ， 定 义 为 
An = ~[n—p~1~1/2(q~p +1 +2)] In ([E1/|5a)). (6.2.8) 
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在 原 假设 Ho 下， 统计 车 收敛 到 自由 度 是 gq(p 一 1) 的 卡 方 分 布 . 


6.3 NMCT 的 步 又 


根据 定理 6.2.1 关于 TT, 的 极限 性 质 和 6.2.4 小 节 中 A, 的 极限 性 质 , 检验 的 p 
值 可 以 通过 它们 的 极限 分 布 ， 即 卡 方 分 布 ， 估 计 . 然而 在 小 样本 的 情况 下 ， 用 极限 
分 布 估计 ? 值得 到 的 功效 可 能 不 好 . 而 且 , 对 统计 量 TT, ,用 代入 的 方法 估计 协 方 
差 矩阵 S 也 会 降低 功效 ， 因 为 在 备 择 假 设 下 ， = 不 再 是 中 心 化 的 分 布 ， 且 协 方差 
矩阵 的 估计 要 比 在 原 假设 下 得 到 的 估计 大 .研究 原 假设 下 TIn 和 An ANS} AHI 
近 已 经 有 一 些 相关 文献 ， 其中， 自助 法 是 最 常用 的 逼近 方法 . 自从 Efron (1979) 关 
于 自助 法 的 工作 之 后 , 文献 中 出 现 了 很 多 不 同 的 自助 法 ， 其 中 ,对 模型 检验 的 自助 
法 包括 Wild 自助 法 (Wu, 1986; Hirdle, Mammen, 1993; Stute, Gonzélez Manteiga, 
Presedo Quindimil, 1998). 然而 ， 上 述 自 助 法 同样 要 求 估计 D. 


6.3.1 关于 TT, 分布 的 NMCT 逼近 


由 于 误差 。 不 可 观测 ， 不 可 能 产生 和 < 具有 同 分 布 的 参考 数据 ， 上 述 的 算法 
不 能 直接 应 用 到 回归 问题 的 检验 .注意 到 统计 基 是 基于 残 差 的 ， 为 了 逼近 检验 在 
原 假设 下 的 分 布 ， 我 们 不 能 像 第 2 章 那样 简单 地 模拟 残 差 ， 因 为 在 备 择 假设 下 ， 
基于 模拟 残 差 得 到 的 蒙特 卡 罗 检验 的 分 布 并 不 是 对 原 假设 下 分 布 的 逼近 ， 而 是 对 
备 择 假设 下 分 布 的 逼近 . 我们 必须 首先 研究 检验 的 结构 ， 然 后 确定 如 果 构造 蒙特 
卡 罗 检 验 . 

根据 式 (6.2.6) 关于 Tri 的 渐 近 表达 式 ， Tr 的 第 一 项 与 误差 有 关 ， 第 二 项 
和 备 择 假设 的 回归 函数 有 关 . 所 以 基于 第 一 项 逼近 检验 在 原 假设 下 的 分 布 ， 本 
节 只 给 出 误差 是 椭 球 对 称 分 布 的 算法 .类似 地 ， 可 以 得 到 第 2 章 其 他 分 布 族 的 
算法 ， 

步骤 1 产生 iid. 的 随机 变量 wi = N/N = 1,… ,n， 其 中 Ni 是 正 态 分 
Hi N(O, lq). BAR, ui 是 球面 上 的 均匀 分 布 . 记 Un := {uni = 1, pn}, EX Ta 
的 条 件 表达 式 





Tn) = Ly lel (63.1) 
j=l 


BH, Vy = {W (8, 23) — BW, XDA, XTS -HAA 25))}. 
得 到 的 统计 其 TT, = TET, 的 条 件 统计 量 


TT;(U) = 区 (om 区 (om)]. (6.3.2) 
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步骤 2 PA MAU, 记 为 U9,i=1,…,m , BB mA TTA Un) 的 值 ， 
WH (TT,(Un)), = 1,--- ,m. 

SMS pIE P =k/(m+1), kR(TT,(Un)) 值 大 于 或 者 等 于 TT, 
值 的 个 数 ， 对 给 定 的 水 平 a ， 如 果 p < a ， 拒 绝 原 假设 Ho. 

注释 6.3.1 根据 以 上 步骤 ， 可 以 用 与 TT 不 同 的 统计 量 TT, 得 到 TT 的 功 
&, HTT, 并 不 是 刻度 不 变 的 . 这 是 因为 用 NMCT 法 得 到 的 条 件 统计 量 估计 检 
Bee p 值 时 ， 统 计量 中 的 常数 部 分 对 p 值 估计 不 会 造成 影响 ， 所 以 ， 在 这 种 情况 
下 ， 剂 度 不 变 并 不 重要 ， 接 下 来 的 定理 给 出 通过 的 相合 性 . 

定理 6.3.1 假定 nt Eads M) 依 概 率 收 敛 到 震 ， 如 果 定 理 6.2.1 的 
条 件 成 立 ， 则 对 几乎 所 有 序列 {(Zi,9i)(i = 1,… ,nn,…)}, TTo Un) 的 条 件 分 布 收 


n 


HB) TT 在 原 假设 下 的 极限 分 布 . 如 果 (1/n) 六 (Vj n) (V ory)? 依 概 率 收敛 到 常 


jal 
MSE, TT! (Un) 依 分 布 收敛 到 TT , TT 的 分 布 与 TT 在 原 假设 下 的 极限 分 布 
KRA. F 
ME e 的 分 布 完全 是 非 参 数 的 ， 基 于 1.2.3 小 节 的 思想 我 们 可 以 很 容易 构造 如 
下 NMCT 步 又 ， 
步骤 1 产生 均值 为 0 ， 协 方差 矩阵 为 1 的 ii.d. 随机 向 量 wi,i = 1, ， 
且 其 支 集 有 界 . 记 Un := {ui,i = 1,… ,n} ， 定 义 Th 的 条 件 对 应 表达 式 为 





(Un) = DD (6.3.3) 


j=1 


sth, Gj = {Ww(B zy) EB((W(B, XD, x) TS DÂ, z;))}. 
相应 TT 的 条 件 统计 量 是 


TT; (Un) = [Tn(En)]" [Tn(Un)]- (6.3.4) 


步骤 2 产生 m Un, 不妨 记 为 UP i=1,- ,m ， 相 应 地 得 到 m 个 TT, 
(Un) 值 ， 记 为 (TT{(Un)),i = 1,-++ m. 

步骤 3”p 值 的 估计 为 5=k/(m +1) ,其 中 是 (TTLUp)) 值 大 于 或 者 等 
于 TT, 值 的 个 数 ， 对 给 定 的 水 平 a ， 如 果 p < a ， 拒 绝 原 假设 Ho. 


定理 6.3.2 假定 (1/n) D (Vj-mj)(Vi-nj)” 依 概率 收敛 到 零 ， 且 定理 6.2.1 的 条 


j=1 
件 成 立 , 则 对 几乎 所 有 序列 {Tyi i= 1, ,n,… ,} ,由 上 述 步 又 1 得 到 的 条 件 
统计 量 TT, (Un) 的 条 件 分 布 收敛 到 TT,, 在 原 假设 下 的 极限 分 布 . 如 果 (1/n) Y (V; 
j=l 
ng )(Vj m)" HAE SE BH RIE, TT (Un) 依 分 布 收敛 到 TT , TT 的 分 布 与 
TT 在 原 假设 下 的 极限 分 布 不 同 . 
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6.3.2 XF An 分 布 的 NMCT 逼近 
首先 研究 统计 量 4 的 结构 . SY = (加 ym), Æ = (21, ,Zn), Xo) = 


(2 外,… a), E = (e1,… ,en) 分 别 表示 q x n 的 响应 变量 矩阵 ，p xm 和 (p 
D x n 的 协 变量 矩阵 ， 以 及 9 x n 的 误差 着 阵 根据 B= (XAT) “4 和 Bo) = 
(toxa) Ta", 
Y-yxT (xxn) x = € [ -aT (xa) “al. 
era) (Ka) Xo 7 elt - 48 (4%) xo], 
其 中 ， 了 表示 nxn 的 单位 矩阵 ， 从 第 6.2.4 KEL My 的 定义 ， 有 
Se [» ~yat (xaT) va] > ~yaxt (xar) a] i 
= efr = x (xaT) ae"; 
h= [> ~ YX) (zod) xo] p -VX (ža) xa) 
= efr -Xa (Xoxa) ao] ET. 


根据 上 面 的 两 个 公式 , 如 同 第 6.3.1 小 节 , 产生 gxn ARDERE Un = (u ,am) ， 
EX È A Dy 的 条 件 表达 式 : 


EU) = (Un é) F at(xat) a] (Un . 8; 
Ean) = (tn È) | -4 (xax) “x (Un a 


这 里 ，“'” 表 示 点 乘 , 见 第 1 章 第 1.2.2 小 节 关 于 点 乘 的 定义 , 相应 得 到 A, 的 条 件 
统计 量 An(Un) ; BARDHE m 次 产生 m 个 An(Un) = —[n - p-1-1/2(q—p+ 
1+ D) in (|2Un)|/1E2Un)]) fH, IEA AUP), AU) ;计算 Ay Ue?) 
大 于 或 者 等 于 An ORC, E p 值 的 估计 k/(m +1). 

类 似 于 定理 6.3.1 的 结论 ， 以 下 定理 说 明 An (Un) 和 An 的 渐 近 等 价 性 . 

定理 6.3.3 AR X 和 工 的 4 阶 距 存 在 则 对 几乎 所 有 序列 (Eny), 
(En, Yn)}, An(Un) 的 条 件 分 布 收敛 到 An 在 原 假设 下 的 极限 分 布 . 
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6.4 模拟 和 应 用 


6.4.1 ”关于 得 分 类 型 的 模型 检验 
例 6.4.1 分 析 以 下 模型 


Y=BTX+cX?+e (6.4.1) 





其 中 ，Y 和 XX 分 别 是 9 EA pi, XA = Thar, AX 服从 多 元 正 态 
Ai N(0,Ip). 为 了 说 明 NMCT 功效 ， 考 虑 误差 e 的 三 种 不 同类 型 的 分 布 : 正 态 分 
布 N(0, 14) ; (-0.5,0.5)9 上 的 均匀 分 布 Us( 一 0.5,0.5) ;以 及 所 有 分 量 为 自由 度 1 
的 卡 方 分 布 x2(1). 原 假设 成 立 当 且 仅 当 c = 0 ， 在 模拟 中 ， 为 了 研究 检验 对 备 择 
假设 的 敏感 性 ，c 的 不 同 取 值 分 别 为 c = 0,0.1,0.2,… ,1. p=3, g=2UR 
8 =B =(1,0;1,1;0, 1). 

如 果 认 为 备 择 假设 有 方向 性 ， 权 重 函 数 选择 为 X?. 正如 上 述 所 讨论 的 ， < 和 
X 的 残 差 图 可 以 对 选择 合适 的 权重 函数 提供 信息 . 在 = 0.5 时 ， 产 生 300 个 数据 
之 后 ， 在 原 假设 下 拟 合 模型 式 (6.4.1) 得 到 的 残 差 Yi — GTX 和 BEX (i = 1,2) 的 散 
点 图 见 图 6.1. 从 图 中 看 它们 之 问 有 平方 关系 ， 因 此 权重 函数 可 选 为 X?. 在 具体 模 
拟 计算 中 ， 权 重 函 数 选择 为 W(X) = X?. 














BEX BX 
图 6.1 c= 0.5 时 ， 在 原 假设 下 拟 合 模型 式 (6.4.1) 得 到 的 残 差 Y- ATX A ATX (i = 1,2) 
的 散 点 图 


由 于 本 文 首次 研究 多 元 响应 变量 的 检验 问题, 文献 中 没有 相关 研究 , 模拟 部 分 
只 比较 由 统计 量 的 极限 分 布 确定 临界 值 和 由 NMCT 法 确定 临界 值 时 ， 检 验 的 经 验 
功效 ， 样 本 量 的 大 小 分 别 为 n = 20,40, 60. 根据 图 6.2 ， 如 果 样本 n = 20 时 ， 很 明 
显 由 NMCT 法 得 到 的 功效 更 好 ， 另 外 一 个 有 趣 的 发 现 是 ， 虽 然 在 样本 较 大 的 情况 
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下 两 个 方法 得 到 的 功效 非常 接近 ， 对 误差 的 所 有 不 同 分 布 ， 由 NMCT 法 得 到 的 功 
效 比 由 分 布 的 极限 得 到 的 功效 好 . 
| 20 z a ooo r0 , 
Pe jue | | £ 
2 ie r 
Ros fo veo! yg jos; 4 
一 / i 
Z = — at So 一 mit 
| er| aa |< wer) a c= mcr 
oy 0.5 Lo 0.5 1 ° 0.5 1 
m2 e m0 e mo e 
-一 -一 OO 
2 p: 6 
i Bi > 
x E x 2 Ros / 
X os E sa Ros. i f 
[Da pg [Timi] | 7 Limit 
Ke “Le = Nerd tie - NMcd| = 一- NMCT 
0 os 1 0 05 i So 05 1 
m2 £ n40 C n0 e 
ip ee ae 一 一 1 
| i 
aoe H p 
ES | 
x asf, > Bos 4 | osi 
ia Lina i [=D] oat 
> = NMCT | Le NMcT | 一 -NMCT 
% os 1% 05 or h 05 1 
c c c 


图 6.2 c 取 不 同 值 时 对 模型 式 (6.4.1) 检验 的 经 验 功效 
第 一 列 是 误差 服从 正 态 分 布 的 功效 ， 第 二 列 是 误差 服从 卡 方 分 布 的 功效 ， 第 三 列 是 误差 服从 均匀 分 布 的 功效 


6.4.2 ”用 4 统计 量 的 诊断 
考虑 如 下 的 线性 模型 , 
Y = (Ba X) + BG) X® +e, (6.4.2) 


其 中 ， 工 是 9 维 向 量 ，X = (XO,(xX)T)T 服从 多 元 正 态 分 布 N(0, p), XO 
和 XO 分 别 是 独立 于 < 的 1 和 (p—1) 维 向 其. 研究 三 种 不 同类 型 的 误差 分 布 : TE 
态 分 布 N(0, Ia); (0.5,0.5)* 上 的 均匀 分 布 Ug(—0.5,0.5) ， 以 及 分 量 是 自由 度 1 
的 卡 方 分 布 组 成 的 x2(1) 分 布 . 原 假设 成 立 当 且 仅 当 c = 0. 在 模拟 中 , 为 了 研究 检 
验 对 备 择 假设 的 敏感 性 ，c 的 不 同 取 值 分 别 为 c= 0,0.1,0.2,… ,1. p=3, q=2, 
Bay = (1,1;0,1) 以 及 Bl = (1,0). 模拟 结果 见 图 6.3 ， 从 图 中 看 ， 在 所 有 情况 下 ， 
由 NMCT 通 近 得 到 的 检验 功效 比 由 渐 近 分 布 得 到 的 功效 好 ， 在 样本 量 小 的 时 候 万 
其 明显 . j 
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图 6.3 c 取 不 同 值 时 对 模型 式 (6.4.2) 检验 的 经 验 功 效 
第 一 列 是 误差 服从 正 态 分 布 的 功效 ， 第 二 列 是 误差 服从 卡 方 分 布 的 功效 ， 第 三 列 是 误差 服从 均匀 分 布 的 功效 


6.4.3 ”实例 分 析 


Johnson 和 Wichern (1992) 分 析 了 在 1984 年 奥林匹克 运动 会 的 各 种 田径 比赛 
成 绩 ， 对 有 关 的 女子 比赛 成 绩 ， Dawkins (1989) 用 主 成 分 分 析 的 方法 研究 在 各 种 
田径 比赛 中 , 不 同 国家 运动 员 的 强项 ,以 及 相对 强项 ， Zhu (2003) 研究 了 长 跑 成 绩 
和 短跑 成 绩 之 间 的 关系 . Johnson 和 Wichern (1992) 给 出 55 个 国家 的 女子 分 别 在 
100 米 ，200 米 ，400 米 ，800 米 ，1500 米 ，3000 米 ,以 及 马拉松 比赛 中 的 最 快 获 
胜 的 时 间 . 本 章 关心 的 问题 是 如 果 国家 女子 的 长 跑 成 绩 好 ,是 不 是 意味 着 短跑 成 绩 
也 很 好 ? 为 了 使 分 析 更 合理 ， 把 获胜 的 最 快 时 间 转化 为 速度 ， 分 别 记 为 z1,… , 27. 
假定 100 米 ， 200 米 和 400 米 是 短跑 ， 1500 KRW LASHER AK. 100%, 
200 米 和 400 米 的 速度 (zl, zz, zs) 为 协 变量 ， 1500 米 ， 3000 米 和 马拉松 的 速度 
(Yi, Yo, Yo) 为 响应 变量 .在原 假设 下 ， 变 量 之 间 是 线性 关系 . 

用 第 6.2 小 节 提 出 的 统计 量 TT 检验 该 模型 . 关于 NMCT 逼近 ， 假 定 误差 分 
布 为 两 种 情况 , 即 顶 球 对 称 分 布 和 完全 非 参数 分 布 两 种 情况 . 因此 , 分 别 用 第 6.3 小 
节 中 对 应 的 两 种 算法 估计 检验 的 p 值 ， 从 图 6.4 看 ， 马 拉 松 速度 Ys 和 协 变量 x; 
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(i = 1,2,3) 之 间 有 非 线性 关系 ， 他 们 之 间 也 许 存 在 平方 关系 . 因此 ,选择 X3 为 权 
重 函 数 W. TT, 的 渐 近 分 布 得 到 的 p 值 为 0.09. 在 误差 是 椭 球 对 称 分 布 和 完全 
非 参数 分 布 假定 下 ， 由 第 6.3 小 节 中 两 种 算法 分 别 得 到 的 了 值 为 0.0001 和 0.03. 显 
然 ， 拒 绝 原 假设 ， 认 为 模型 不 符合 线性 关系 ， 另 一 方面 ， 从 图 6.4 中 看 ， 非 线性 部 
分 主要 来 自信 ， 且 Y3 和 XX; (i= 1,2,3) 之 间 可 能 存在 平方 关系 ,这 说 明 国家 在 短 
跑 上 的 强项 或 者 弱项 与 国家 在 长 跑 上 的 强项 或 者 弱项 之 间 没 有 线性 关系 ， 如 果 用 
Xi, Xo, Xs 和 X3 为 协 变量 做 线性 拟 合 ， 由 TT 渐 近 分 布 得 到 的 p 值 为 0.97 ; 在 
误差 是 椭 球 对 称 分 布 和 完全 非 参数 假定 下 ， 由 第 6.3 小 节 中 两 种 算法 分 别 得 到 的 p 
值 分 别 为 0.34 和 0.99. 检验 结果 对 模型 中 是 否 包括 X3 项 给 出 了 根据 . 


25 30 50 





Yı 
x 
8 
Ye 














150 i 12 13 159 11 12 13 205 13 
xX Xi 
25 30 50 
25 40 


Yı 
» 
% 


20 









































"59 i4 o 12 14 746 i4 
% 
25 30 50 
25 40 
= 20 xs x 
20 30 
15 Z$ 15 20 zieh 
0 w dee o i A ae 0 z 6 
为 x xX 


图 6.4 关于 1984 年 奥林匹克 比赛 数据 ， 响 应 变量 Yi, Yo, Yo 分 别 和 协 变量 X1, Xo, Xs 的 
散 点 图 


接 下 来 讨论 用 似 然 比 统计 量 研究 传统 的 检验 问题 ， 注 意 到 100 和 200 米 的 速 
度 是 相关 系数 为 0.9528 的 变量 ，X1 关于 Xo 做 回归 , 可 得 Xp = 1.1492Xi. 因此 ， 
考虑 新 的 模型 


Y = aX, +bX24+dX3+cX? +e, (6.4.3) 
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这 里 ， XX = X2 一 1.1492X1, Xo = Xo + 1.1492X1. MRM MY 是 否 有 显著 影 
响 ， 也 就 是 系数 是 否 满足 a = 0. 由 An 的 渐 近 分 布 得 到 的 p 值 为 0.08 ; 如 果 误 差 
服从 均匀 分 布 或 正 态 分 布 ， 由 NMCT eC p 值 分 别 为 0.20 和 0.38. 所 有 的 
检验 结果 表明 X X Y 的 影响 很 小 ， 因 此 ， 可 以 用 模型 


Y = bX2+dX3+cX? +e 


建立 Y 和 Žo, Xs, X? 之 间 的 关系 . 





6.5 ”定理 的 证 明 


证 明 引 理 6.2.1 由 于 D—/2(7 + S) 服从 正 态 分 布 N(5-1/25,1,) ,这 里 表 

T oo ANE, 因此 号 -1/2(T+ 5) 的 分 量 , 不 妨 记 为 wifi = 1,… ,9) ,是 均值 为 
» 方差 为 1 的 正 态 分 布 ,其 中 v AME 了 -2S 的 分 量 , 因此 (T-+SJ7Z-I(T+S) 
dC uito)? ,也 就 是 非 中 心 值 为 好 的 独立 非 中 心 卡 方 分 布 之 和 . 如 果 响 应 


向 量 是 - 维 的 ， 对 任意 c > 0, 在 |vi| 很 大 时 ，P{(wi+vi)? > c} 很 小 . 考虑 9 = 2 的 情 
BL, (u+)? +(u2+v2)? 的 分 布 是 两 个 分 布 的 卷 积 , 由 于 P{(ua +01)? + (u+)? > 
0}=/(1- Fw (ec— £2))d Fv (72) = f (1 — Fov (€ — 21))d Fi v, (21). 那么 对 任意 满 
Æ lvi| > loil 的 两 组 向 其 (en, v2) 和 (vp, 0), HHP u 和 wo 独立 ， 可 得 

















Plla +0)? + (ua + 02)? >e} = [1 — Fin (€= 22))d Fona (22) 
> f- Fi (€= 22))d Fasos (22) = JU- Pml -ma le) 
> fO- Fan (€= 22))A Fi (22) = PE + of)? + (ua + 06)? > c). 


MARARA IE CHES n, AI ARR. 
证 明 引 理 6.2.2 WV =SIPV = (VIO... (VIM). 由 于 S = E(VOn), 
则 yee dav ‘YOn®))?. 根据 Cauchy-Schwarz 不 等 式 和 EVO? = 1, 可 
T 5-1 (i) 2 Éy. al NÀ) = pn(i) 2))2). 
得 STD- S< Y (ERP, RR AL (VO = 1 /\/(E)2) 
证 明定 理 6.3.1 在 原 假 设 下 


12 
th = FLV es + op(1). (6.5.1) 


不 难看 出 , 给 定 序列 {(zi， lleil),i=1, ,因为 6;/leyl| 和 lleill 独立 , E 
jls 和 wj FA, n= X Vie ofl na X Vu: lejl 同 分 布 这 说 明 Th 
jsi = 
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的 极限 分 布 和 n-1/2 È V -uj lezl FAA. 如 果 n-1/2 È 太刀 el 的 渐 近 分 
j=: j= 
布 是 Ta(Un), IRB, n A Ta (Un) 渐 近 同 分 布 ， 接 下 来 说 明 n $ Vj uy esl 


和 Ån (Un) 渐 近 同 分 布 . 
注意 到 





Bn) = LG w leh (6.5.2) 
j=1 


uj 和 {(zj, 奶 ),j = 1,… ,nn} 独立 ， 而 且 包 含 在 Vy Al 6; 中 的 所 有 估计 都 相合 ， 根 
据 Taylor 展开 式 ， 很 容易 证 明 


1S 1 Š ane 
Fad [a s: Nesl Vs mse] = Fe Ds [P est Yel 


依 概率 成 立 ， 定 理 证 毕 . 

证 明定 理 6.3.2 要 得 到 定理 的 结论 ， 只 需 证 明 两 件 事情 , M: © 互 (Un) 的 渐 
近 正 态 性 ，@ Ty(Un) HAHA Ë, 极限 的 协 方差 矩阵 .由 于 uy 独立 于 
{ep usd = hn}, MAR ((ey)}, Fa(Un) AHA ARSENE (1/n) È Ù- 


六 
EW ET. MEERA E, A Taylor 展开 式 和 弱 大 数 定理 ， 和 式 收 
KA E[(V .e)(V .6)"] ， 它 也 是 Te 极限 的 协 方差 ， 关 于 渐 近 正 态 性 ， 由 于 给 定 
{(eiu)}, Tr(Un) 为 id, 随机 向 量 之 和 ， 根 据 中 心 极限 定理 ， 极 限 分 布 服从 正 
态 分 布 N(OE[(V-e)(V-e)"]) ， 此 极限 分 布 和 Tn KRAAI, ERRER. 

证 明定 理 6.3.3 这 个 定理 的 证 明 过 程 和 前 面 的 定理 证 明 过 程 基本 上 相同 ， 细 
TRTE. 
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假定 回归 模型 同方 差 之 前 , 应 该 检验 模型 的 异 方差 性 , 观察 残 差 图 是 一 种 经 常 
使 用 的 方法 . 残 差分 析 也 可 以 用 来 构造 异 方差 性 检验 , 关于 这 方面 检验 得 比较 全 面 
的 讨论 可 参考 文献 Carroll 和 Ruppert (1988, 3.4 47). 

对 于 参数 形式 的 回归 函数 和 方差 函数 ,关于 异 方 差 检验 的 研究 文献 有 Cook 和 
Weisberg(1983) 的 得 分 类 型 检验 ，Davidian 和 Carroll(1987) , 及 Carroll 和 Ruppert 
(1988) 的 伪 似 然 检验 ， 大 部 分 的 研究 工作 是 基于 正 态 误差 分 布 的 假定 下 ， Bickel 
(1978) 把 传统 的 检验 框架 扩展 到 非 正 态 误差 的 情况 . 在 回归 函数 是 线性 的 情况 下 ， 
Carroll 和 Ruppert (1981) 进一步 研究 了 Bickel 检验 的 性 质 . 

近来 ， 对 非 参数 回归 函数 的 情况 , 也 有 一 些 关于 这 方面 问题 的 研究 . 如 果 误 差 
是 正 态 分 布 ， 在 回归 函数 是 非 参 数 的 情况 下 ， Eubank 和 Thomas (1993) 构造 了 得 
分 检验 的 统计 基 . 在 正 态 误差 和 线性 模型 情况 下 ， Diblasi 和 Bowman (1997) 基于 
非 参 数 光滑 方法 构造 检验 统计 其 ， 它 实际 上 就 是 对 残 差 做 变换 之 后 的 得 分 检验 . 
Dette 和 Munk (1998) 对 固定 设计 的 非 参数 回归 模型 构造 统计 量 ， 检 验 具 有 比较 好 
的 性 质 ， 它 不 要 求 直 接 估 计 回归 函数 ， 也 不 依赖 光滑 参数 的 选择 在 高 维 的 情况 ， 
Müller 和 Zhao (1995) 提出 了 关于 误差 异 方差 性 的 检验 ， 除 了 对 误差 的 阶 数 做 一 些 
限制 ， 实 际 上 就 是 误差 的 8 阶 距 存在 ， 没 有 对 误差 的 分 布 做 任何 限制 ， 文 章 也 研 
究 了 在 原 假设 下 检验 的 极限 分 布 ， 但 是 并 没有 通过 理论 和 数据 模拟 研究 检验 的 功 
效 ，Eubank 和 Thomas(1993) 在 有 方向 的 局 部 备 择 假设 下 研究 了 检验 的 性 质 . 

本 章 对 高 维 参数 和 非 参 数 回 归 模 型 提出 统一 的 方法 构造 检验 统计 量 ， 除了 假 
定 方差 函数 连续 且 4 阶 距 存在 ， 对 误差 分 布 没 有 其 他 任何 的 假定 . 所 以 , 模型 具有 
更 一 般 性 ， 且 模型 的 假定 比 文献 Müller 和 Zhao(1995) 的 模型 假定 弱 ， 对 研究 的 所 
有 的 回归 函数 和 方差 函数 , 统计 量 可 以 检测 到 依 1/V 的 速度 逼近 原 假 设 的 备 择 假 
设 . 值得 一 提 的 是 , 本 章 关 于 随机 设计 模型 的 研究 结果 很 容易 推广 到 固定 设计 模型 
的 情况 . 

如 果 研 究 的 是 非 参 数 模型 , 需要 用 非 参 数 光 滑 的 方法 估计 回归 函数 , 同时 包含 
有 光滑 参数 的 选择 .一 般 来 说 ， 要 考虑 不 同 的 光滑 参数 是 否 很 明显 地 影响 估计 的 
有 效 性 . 对 本 章 所 提出 的 统计 量 ,光滑 参数 的 选择 并 不 是 非常 重要 . 在 光滑 参数 较 
广 的 取 值 范围 ， 统 计量 的 极限 分 布 相同 . 如 果 协 变量 是 一 维 的 ， 且 给 定 协 变量 时 误 
差 的 条 件 4 阶 距 为 常数 (如 误差 和 协 变量 独立 ) ， 检 验 的 渐 近 分 布 不 依赖 误差 的 分 
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布 . ERER, RRE ERRA ER. 为 了 确定 临界 值 ， 蒙 
特 卡 罗 逼 近 原 假设 下 统计 量 的 分 布 是 其 中 常用 的 方法 之 一 ， 本章 同 时 研究 了 传统 
自助 法 和 NMCT 法 的 性 质 ， 相 关 的 工作 可 参考 文献 Stute, González Manteiga 和 
Presedo Quindimil(1998) 以 及 Stute, Thies 和 Zhu (1998). 


7.2 检验 的 构造 及 其 性 质 


7.2.1 ”检验 统计 量 的 构造 


考虑 如 下 回归 模型 
Y =¢(X) +e, 


其 中 ，X 为 d 维 协 变量 ，E(s|X = z) = 0 ， E(X = 2) = 0°(x). 本 章 所 研究 的 
检验 问题 是 ， 在 原 假设 下 ， 


Ho: 02(-) = 0?( 常 数 ) 成 立 ; 





在 备 择 假设 下 ， 
Ay: 0?(-) 是 非常 数 函 数 . 


显然 ， 如 果 原 假设 成 立 ， o? 就 是 e 的 方差 Ee?. 因此 ， Ho 成 立 等 价 于 对 几乎 所 
有 z， 
E(e?|x) — E(e?) = 0. 


假定 X 的 分 布 函数 FO 连续 ， 上 式 等 价 于 
T(z) := fr < 2)(E(e?|X) — E(e))dF(X) 
= E(e(I(X <2) ~ F(z))) = 0， (7.2.1) 


其 中 ，“X <a 表示 X 的 各 个 分 量 小 于 或 者 等 于 z 的 相应 分 量 . 记 (eit), 
(Enn) 为 观测 数据 ， 基 于 这 组 数据 拟 合 模型 如 = 6(zi) 得 到 残 差 & =y- hi, HK 
中 Glz) 为 O(a) 的 估计 ， T(x) 的 经 验 形式 为 


T(t) = 六 Ce <2) - Fal), (7.2.2) 
2 


其 中 ，F 是 {z1,… ,zn} 的 经 验 分 布 函数 . 根据 上 述 结论 , SITET Ey T 的 
函数 ， 本章 定义 Cramér-von Mises 类 型 的 检验 统计 量 ， 即 Ty 的 平方 形式 


Wa = ncz? f [Ta(z)|24F, (2), (7.2.3) 
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其 中 ，C2 是 名 的 样本 方差 ， 它 使 得 统计 其 是 标准 化 的 检验 . 

上 述 检 验 的 思想 可 以 应 用 到 很 多 类 型 模型 的 检验 中 . 对 不 同类 型 的 模型 , 在 估 
计 回 归 函 数 的 同时 研究 它们 的 性 质 , 以便 证 明 检验 的 性 质 . 本 章 只 考虑 两 种 类 型 的 
模型 ， 也 就 是 以 下 参数 和 非 参数 回归 模型 . 

1) SH: Y= %p(X) +e, HP o 为 已 知 函数 ， 首 先 根据 数据 估计 6 得 
到 pale), MERZ yj — palti). 根据 式 (7.2.2) 和 (7.2.3) 构造 统计 基 . 

2) 非 参 数 模型 ， Y = p(X) +e ， 其 中 少 是 未 知 函数 ， 用 非 参数 光滑 的 方法 得 
到 OC) 的 估计 OO) 和 残 差 yy — 8(z;) ， 然 后 根据 式 (7.2.2) 和 (7.2.3) 构造 统计 量 . 


7.2.2 Th 和 Wi 的 渐 近 性 质 

本 章 只 详细 讨论 线性 和 非 参 数 模型 中 , 检验 的 极限 性 质 .对 参数 模型 可 以 得 到 
类 似 的 结果 . 假定 (z1, 级 ),… (En Yn) 是 iid. 的 观测 数据 . 

1) 线性 模型 的 情况 

对 线性 模型 了 = a+B' 和 +e ,6B 的 最 小 二 乘 估计 为 B= $- Y (@j)-2)(yy-9), 


j=1 
其 中 S 表示 z 的 样本 协 方差 矩阵 . 假定 X 的 协 方差 矩阵 , KNN S, AREE 
定 , 则 是 6 的 Va 相合 估计 , 也 就 是 BB = 0,(1/Vn). a 的 估计 4=5- Ps， 
RÉ êi = yi 一 一 rzi. 接 下 来 的 定理 分 别 给 出 式 (7.2.2) 和 (7.2.3) 中 关于 T 和 
Wn 的 渐 近 性 质 . 
定理 7.2.1 RX 的 分 布 已 连续 ， 和 和 = 的 4 阶 距 有 限 ， 且 X 的 协 方差 
矩阵 5 正定 ， 则 在 原 假设 Ho F, 





F 


Ta, = By, (7.2.4) 
在 Skorohod 空间 D[—o0,00)4 RÈ, H 
Wa = W := 07? [ Beare, 


其 中 ， Se" RPGR, AR X 的 维 数 ， Bi 为 中 心 化 的 Gaussian 过 程 ， 对 任 
意 了 Z 和 zl ， 它 的 协 方差 函数 是 
E(By(2)Bi(a)) = B[(e? -oz)2(ICKC<zAz)- Fla) (X < 21) 
—F(a1)I(X < x) + F(e)F(a1))]. (7.2.5) 


0? 是 62 的 方差 ， 如 果 z 和 z1 为 一 维 变量 ，“ 人 ”表示 这 两 个 变量 取 最 小 ， 否 则 
表示 两 个 向 量 的 对 应 分 量 取 最 小 . 
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2) 非 参 数 情况 

对 非 参数 模型 ， 情 况 相 对 比较 复杂 .在 线性 模型 中 ， 参 数 的 估计 可 以 达到 Vin 
的 收敛 速度 .在 非 参 数 回归 模型 中 ， 估 计 达 不 到 Vn 的 收敛 速度 .如 果 协 变量 XX 
的 维 数 是 4 ，m 表示 回归 函数 和 X 分 布 函数 光滑 程度 ， 函 数 的 估计 可 能 只 能 达到 
no(M+D/(2(m+)+d) 的 速度 收敛 到 真实 的 回归 函数 (参考 后 面 的 7.5.1 小 节 ). 本 章 用 
核 函 数 定义 非 参 数 函 数 6 HIT, X g(z) = 9(z)f(z) ，g(z), f(z) 和 9(z) 的 核 估 
计 9(z), f(z) 和 6(z) 分 别 具 有 下 述 形式 : 





Ge) = = So wyKale—2y), fo) = E Kale- ss), 
j=l j=l 
$7) = H(z)/ f(z), (7.2.6) 


SCH, h HAR, KO WAER, Kal) = K(/h)/ht. 此 时 残 差 6; = yi — 9(zi). 

定理 7.2.2 假定 7.5.1 小 节 中 的 条 件 1)~5) 成 立 ， 则 在 原 假设 Ho 下 ， 对 由 
KE êi = yi — lzi) 构造 得 到 的 T 和 Wi， 定理 7.2.1 的 结论 仍然 成 立 ， 

下 面 的 推论 说 明 在 一 些 特别 情况 下 统计 量 的 性 质 . 

推论 7.2.1 假定 定理 7.2.1 或 者 定理 7.2.2 的 条 件 成 立 ， 如 果 在 原 假设 下 
E((e? ~ a3)2|X) ARR. MT, 弱 收 敛 到 中 心 化 的 Gaussian 过 程 By, HER r 
和 ZT1 ， 它 的 协 方差 函数 是 


E(Bi (x) Bi(21)) = CPE[(I(X < z A21) — F(a)F(a1))], (7.2.7) 


其 中 ,，C? 是 e? 的 方差. 特别 的 ,如 果 协 变量 是 一 维 的 ，Wi, HAF fy B2(z)dz ， 
B ği Brownian 桥 . 
接 下 来 研究 检验 对 备 择 假 设 的 敏感 性 ， 考 虑 下 述 备 择 假设 


oz(z) =o2+s(z)/nra，a>0. (7.2.8) 


以 下 定理 说 明 检验 对 全 局 备 择 假设 (对 应 于 a = 0) 相合 ， 而 且 它 可 以 检测 到 
以 1/Vn 的 速度 (对 应 于 0 < a < 1/2) 逼近 原 假设 的 局 部 备 择 假设 . 

定理 7.2.3 假定 定理 7.2.1 关于 参数 模型 或 者 定理 7.2.2 关于 非 参数 模型 的 
条 件 成 立 ， 则 在 备 择 假设 式 (7.2.8) 下 ， 如 果 0 < a < 1/2 ， Wn co 依 概率 成 
立 ， 如 果 a=1/2 ， 

Tn => B; + SF, 

其 中 ， S>” Arika, SF(z) = E(s(X)(I(X < z) — F(x))) 表示 非 随机 漂移 
函数 ， 因 此 ， 对 连续 的 分 布 函数 F, Wa = C? f(Bi + SF)?dF. 

关于 统计 量 的 临界 值 的 确定 ， 如 果 协 变量 是 一 维 的 ， 且 在 原 假设 下 误差 和 X 
独立 ， 可 通过 已 有 的 表格 查找 渐 近 分 布 的 分 位 点 ， 见 Shorack 和 Wellner (1986). 但 
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是 在 通常 情况 下 ,特别 是 高 维 协 变 景 时 ， Wo 的 渐 近 分 布 并 不 是 自由 分 布 . 本章 用 
蒙特 卡 罗 逼 近 的 方法 估计 检验 的 p f 
7.3 Sete RY ut 


RATS BH PRAM Se KP BE, 即 传统 的 自助 法 、Wild 自助 法 和 NMCT 
方法 . 

1. 传统 自助 法 

(1) 线性 模型 的 情况 

从 残 差 二 中 有 放 回 的 独立 抽取 bi， Iy? = a+ Bar tb; ， 用 传统 自助 法 得 到 
B 的 最 小 二 乘 估计 ( Efron, 1979) 


B= SS l-a) a = (BYE. 
j=1 


iC bf = bi — (1/n) = by ， 则 由 传统 自助 法 得 到 的 残 差 是 

A 

êj =y} —a* — Bx; = —(8* — B)' (z; — 3) + b}. 
由 此 可 分 别 得 到 Tn 和 Wr 的 条 件 表达 式 : 

Ty (a) = ar Pe 5)? (I(x < x) — Fa(e)) 
以 及 
Wii = Ca? | Tafa Fao) (7.3.1) 
(2) 非 参 数 模型 的 情况 


ef 表示 有 放 回 的 从 & = yi- le) 中 独立 抽取 的 样本 ,， 记 yt = $l) + 
et, G(r) =n 二- Zz)/f(z) ， 则 相应 的 残 差 是 ê& = 好 -ô (e). 由 
= 


此 可 分 别 得 到 Ty 和 Wo 的 条 件 表达 式 
Taa) = FLIE < 2) — Fa(2)) 


Wia =C? f Taare) (7.3.2) 
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定理 7.3.1 在 定理 7.2.1 或 者 定理 7.2.2 的 条 件 下 , 对 几乎 所 有 序列 { (Zz1, 1)， 

-s(n Yn) h A (7.3.1) RA (7.3.2) 的 条 件 统计 量 Wr, 的 极限 分 布 等 于 统计 
È Wn 在 原 假设 下 E((c? 一 o?)?|X) 为 常数 时 的 极限 分 布 ， 分 布 的 协 方差 URL 
论 7.2.1. 

注释 7.3.1 根据 定理 (7.3.1), 可 知 无 论 原 假设 是 否 成 立 , 由 式 (7.3.1) RA (7.3.2) 
得 到 的 条 件 统计 量 Wi, 的 极限 ， 等 于 在 原 假设 下 E(e4|X) 为 常数 时 W， 的 极限 分 布 . 
ElEtX) 为 常数 这 一 结论 只 有 协 变 量 和 误差 独立 的 情况 成 立 , 所 以 由 传统 自助 法 得 到 的 条 
件 检验 在 一 般 情 况 下 是 不 相合 的 ， 它 只 适用 于 一 些 特殊 的 情况 . 

2. Wild 自助 法 

对 本 章 构造 的 统计 基 ， Wild 自助 法 (Wu, 1986; Hirdle, Mammen, 1993) 不 相 
合 . 通过 线性 模型 说 明 它 的 不 相合 性 ， ee 均值 为 0, 方 
差 为 1 的 ii.d. 的 伪 数 据 , 记 e? = wii, yf = Â'r +e, HARE Givi), ney 
(ch, yn) 得 到 8 的 最 小 二 乘 估计 BEE a B= B-B+0,(1//n), M Liu oss 
或 者 Hirdle 和 Mammen (1993). 相应 的 残 差 为 好 一 (B*)'nri = e} — (Ô* — ÊY'zi, 由 
Wild 自助 法 得 到 对 应 T 的 条 件 表 达 式 Tr 为 


T(z) = + Det (T(z; < 2) — Fn(z)) 


vn 


= i a — (Bai)? — ô?)(I (2; < 2) — Fr(a)). 
类 似 于 的 分 解 ， 
au (w? G —ô?)(I(z; < x) — F(z)) 
-全 一 a = wie 525(I(aj < £) — Fn(z)) 


+ Vala" -AVÈ D t25 lles < 2) — Fala ~ ô) 
j=l 
= If (x) - 3 (2) +3 (2). (7.3.3) 


直观 上 讲 ， 由 于 ô 是 Vn 相合 估计 ， 过 程 瑟 = (15(0),c e RO} 收敛 到 零 . 对 过 
程 及 = {及 (Zz),z & R4} ， 求 和 项 是 中 心 化 的 过 程 旦 极限 有 限 ， 又 因为 Â 为 Vi 相 
E BRAAF. 如 果 w? = 1, PH TT = { 玉 (z),z € RY} BF Ty. 如 果 好 不 是 
常数 ， 的 极限 不 等 于 Ta 的 极限 . 因此 ， 由 Wild 自助 法 得 到 的 Wh 的 条 件 统计 
E Wi 并 不 是 渐 近 相合 的 . 
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3. NMCT 方法 
考虑 简单 的 情况 , 记 e1,… ,en 为 等 概率 取 值 £1 的 ii.d. 随机 变量 . 由 NMCT 
法 得 到 的 对 应 T 的 表达 式 为 


Ta(En, 2) = Z does - 6)(I(a; < 2) — Fala), (7.3.4) 
j=l 


其 中 ， By = (e1,… ,en), 相应 的 条 件 统计 量 为 
Wa(En) = Cn? /Cran sa Pale), (7.3.5) 


产生 m 组 Ey ， 不 妨 记 为 EY (i = 1,… ,m) ， 得 到 m 个 Wa(En) 值 ， 记 为 
Wr(Ew (= Ay). VE)) 的 1- a 分 位 点 就 是 W,, 的 水 平 为 a 的 临界 
值 的 估计， 

定理 7.3.2 假定 定理 7.2.1 关于 参数 模型 或 者 定理 7.2.2 关于 非 参数 模型 的 
条 件 成 立 ， 如 果 存 在 a > 0， 使 得 xz(z) = o2 + s(z)/na 成 立 ， 则 对 几乎 所 有 序列 
{(z1y1) (Znyn),…} ， 条 件 统计 量 Wn(En) KR 7.2.1 中 W, 在 原 假 
设 下 的 极限 分 布 . 

在 定理 7.3.2 中 ， s(.) = 0 对 应 于 原 假设 ， s(.) 关 0 对 应 于 局 部 备 择 假设 ， 根 
据 定理 的 结论 ， 在 局 部 备 择 假设 下 由 条 件 统计 其 Wr (En) 确定 的 临界 值 渐 近 等 于 
在 原 假设 下 确定 的 临界 值 . 因此 ， 在 大 样本 的 情况 下 ， 如 果 条 件 方差 o?(z) 以 一 定 
的 速度 通 近 原 假设 ， i 

对 全 局 备 择 假 设 ， 也 就 是 a =0, Wr(En) 的 极限 有 限 ， 然 而 Wi, 趋 于 无 穷 . 
因此 统计 其 也 是 相合 的 . 


7.4 模拟 分 析 


本 节 对 本 章 所 得 到 的 理论 结果 通过 模拟 说 明 检验 的 功效 ， 并 且 和 文献 中 已 有 
一 些 检 验 比 较 模拟 结果 

与 文章 Diblasi AB Bowman (1997) 选取 的 方差 函数 一 致 , 即 ci(z) = 1, cz(z) = 
0.25 + a, o3(x) = 0.25 + 4(a — 0.25)? 以 及 o4(x) = 0.25 exp(z log(5)). 

在 模拟 分 析 中 ， 试 验 重复 500 次 ， 给 定 水 平 a = 0.05. X 7.1 中 给 出 500 次 试 
验 中 拒绝 原 假设 的 比例 .模拟 中 需要 考虑 窗 宽 的 选择 . 类 似 于 Eubank 和 Thomas 
(1993) 用 样 条 估计 时 遇 到 的 问题 ， 理 论 研究 并 不 支持 用 数据 驱动 的 方法 选择 窗 宽 
h. 在 同方 差 的 情况 ， 广义 交叉 验证 法 (GCV) 可 以 得 到 较 好 的 窗 宽 估 计 ， 然 而 在 
异 方差 的 情况 ， 得 到 的 窗 宽 不 一 定 合 适 ， 正如 Diblasi 和 Bowman(1997) 的 做 法 ， 
我 们 考虑 在 较 宽 范围 经验 地 选取 六 的 不 同 值 . 模拟 结果 见 表 7.1 和 7.3. 通过 500 
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次 试验 ， 在 原 假设 下 用 GCV 方法 得 到 窗 宽 的 平均 值 确定 窗 宽 的 选择 范围 ， 在 模 
型 式 (7.4.1) 中 ， 与 Diblasi 和 Bowman (1997) 选择 的 窗 宽 的 方法 一 致 ， 分 别 研究 
“h = 0.08, 0.16 和 0.32 时 检验 的 经 验 功效 . 

TER T1~ 表 7.4 中 , 行 线性” 表示 在 线性 模型 中 用 最 小 二 乘 方 法 估计 参数 . 
SRO 表示 把 模型 看 作 非 参数 的 , 用 核 方法 对 非 参数 回归 函数 估计 得 到 的 结果 . 
核 函 数 选 为 (15/16)(1 一 万 )27(t2 < 1)(Hardle 和 Mammen (1993)). 考虑 协 变量 为 一 
维 的 模型 ， 








= po + Bizi +e: (i= 1,--+ ,n), (7.4.1) 


其 中 ，si 是 均值 为 零 的 独立 正 态 随机 变量 ，z;i 为 [0,1] 上 的 均匀 分 布 . 在 模拟 中 ， 
参数 的 值 分 别 为 pm =1 Al A = 2. 

由 于 模型 式 (7.4.1) 中 e 和 X 独立 ， 检 验 的 渐 近 分 布 的 临界 值 可 参见 文献 
Shorack 和 Wellner (1986) 的 第 748 页 . 在 表 7.1 和 表 7.2 中 ， C&W 表示 Cook 和 
Weisberg(1983) 的 Cook & Weisberg 检验 ，D&B 表示 Diblasi 和 Bowman (1997) 的 
自助 法 检验 ， NEW 表示 本 章 中 的 检验 根据 统计 量 渐 近 分 布 确定 临界 值 的 渐 近 检 
验 ，NMCT 表示 NMCT 逼近 确定 临界 值 方法 ，CBT 表示 传统 的 自助 法 逼近 确定 
临界 值 . 


表 7.1 在原 假 设 下 拒绝 Ho 的 百分比 (ck(z) = 1) 

















n= 50 C&W D&B New NMCT CBT 
线性 4.4 5.0 6.4 5.6 
非 参 数 h = 0.08 4.6 6.0 76 9.2 
OM h = 0.16 44 5.0 5.8 6.4 
非 参 数 h = 0.32 4.8 5.0 44 4.8 
n=70 C&W D&B New NMCT CBT 
线性 5.0 3.8 4.6 5.0 
非 参 数 h = 0.08 4.6 5.4 6.6 8.2 
非 参 数 h = 0.16 4.2 5.6 5.8 6.8 
非 参数 h = 0.32 5.2 44 4.6 5.2 





从 表 7.1 看 ,在 原 假设 下 ， 由 渐 近 检验 得 到 的 功效 比 其 他 检验 得 到 的 功效 好 . 
在 较 宽 的 窗 宽 范围 内 , 由 渐 近 检验 得 到 的 功效 和 给 定 水 平 非常 接近 . 模拟 结果 和 理 
论 结果 吻合 ， 对 线性 模型 ，C&W 的 功效 较 好 . 对 D&B 检验 ，NMCT 和 CBT 检 
验 , 需要 选择 合适 的 窗 宽 , 根据 表 7.1 , 窗 宽 h = 0.32 时 条 件 检验 NMCT 和 CBT 
得 到 的 功效 不 错 ， 在 样本 n= 50 和 n=70 时， 由 GCV 选择 得 到 的 平均 窗 宽 分 别 
是 hccv = 0.30 和 heey = 0.28. 

备 择 假设 下 功效 的 模拟 结果 见 表 7.2 ， 在 非 参 数 情况 下 选择 窗 宽 h = 0.32. 
C&W 检验 假定 误差 的 方差 是 of exp(Xz) ， 其 中 ARA. C&W 的 得 分 函数 选择 
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为 方差 函数 导数 的 中 心 化 表达 式 . 检验 的 功效 依赖 于 具体 的 方差 函数 . 如 果 参 数 假 
定 合理 ， C&W 检验 功效 最 好 . 但 是 没有 任何 一 种 检验 结果 在 任何 情况 下 比 其 他 
的 检验 结果 都 好 . 由 于 渐 近 检验 的 数值 计算 相对 比较 简单 ,而且 适用 于 很 多 不 同 的 
模型 ， 所 以 推荐 用 渐 近 检验 的 方法 . 


表 7.2 Ho 被 拒绝 的 百分比 




















n=50 C&W D&B New NMCT CBT 
oa(z) = 0.25 +2 
线性 92.2 85.4 91.4 87.0 
非 参数 84.8 85.4 87.0 85.4 
oa(z) = 0.25 十 4(z — 0.25)? 
线性 37.6 ` 41.4 19.2 44.8 
非 参数 83.2 39.4 17.2 45.8 
ad(z) = 0.25 exp(x log 5) 
线性 97.0 93.6 96.4 94.4 
非 参数 90.6 92.4 91.6 93.0 
n=70 C&W D&B New NMCT CBT 
aa(z) = 0.25 +2 
线性 97.0 95.4 96.4 96.0 
非 参数 94.4 94.2 94.8 94.6 
oa(z) = 0.25 十 4(z — 0.25)? 
线性 40.8 59.8 23.0 60.8 
非 参 数 96.4 59.8 21.6 59.6 
oa(z) = 0.25 exp(z log 5) 
线性 98.8 99.2 99.4 99.0 
非 参数 98.4 98.6 98.2 98.2 
接 下 来 分 析 模 型 

Yi = Bo + Piva + B2Ti2 + ei, (i=1,..,n). (7.4.2) 


在 模拟 中 , 参数 Go = 1, Bi = 2 和 Bo = 3. si 是 均值 为 零 的 正 态 随机 变量 . 记 a 表 
示 (0.1) EAA, žia = (28a)? ， 协 变量 za 和 zio 分 别 为 ra = Fa + 052i 
和 zi = 0.55i + Gio. 因此 模型 式 (7.4.2) 只 和 变量 有 关 ， 渐 近 检验 NEW 仍然 
适用 ， 模 拟 分 析 了 NMCT 和 CBT 逼近 的 功效 ， 与 Diblasi 和 Bowman(1997) 对 窗 
宽 的 选择 方法 一 样 ，h = 0.16,0.32 和 0.64. 在 样本 n= 50 Al n = 70 时 ， 根 据 500 
次 试验 得 到 窗 宽 的 平均 值 分 别 为 hecv = 0.38 和 jccv = 0.34. 

在 原 假设 下 ， 检 验 的 经 验 功效 见 表 7.3 ， 从 表 中 看 ， 渐 近 检 验 NEW 的 模拟 结 
果 仍 然 不 错 . 

表 7.4 中 给 出 窗 宽 h= 0.32 时 检验 的 功效 ， 渐 近 检 验 和 NMCT 比 其 他 两 种 类 
型 的 检验 结果 要 好 一 些 。 C&W 的 得 分 选择 为 方差 函数 cg exp(Xzi) 导数 的 中 心 化 
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RAK. 即使 在 参数 假定 的 情况 ,得 分 类 型 的 检验 比 其 他 方法 都 要 差 一 些 . 在 一 维 
的 情况 ， 注 意 到 Eubank 和 Thomas (1993) 提出 的 检验 是 C& W 检验 的 一 般 化 形 
sk, 根据 Eubank 和 Thomas (1993) 表 1 的 结果 ， 可 知 o8exp(Xz1) 的 导数 并 不 总 
是 最 优 的 选择 . 


表 7.3 在原 假设 下 拒绝 Ho 的 百分比 (ci(z) = 1) 

















n=50 C&W NEW NMCT CBT 
线性 4.6 5.0 6.4 5.8 
FBR h = 0.16 6.4 9.8 16.2 
非 参数 h = 0.16 6.6 10.2 14.6 
线性 5.8 5.2 6.8 5.8 
非 参 数 = 0.32 5.2 44 6.2 
n=70 C&W NEW NMCT CBT 
非 参数 户 = 0.32 5.4 4.2 6.4 
非 参数 h = 0.64 48 18 4.0 





非 参 数 h = 0.64 5.0 3.6 6.0 


表 7.4 ”Ho 被 拒绝 的 百分比 




















n=50 C&W NEW NMCT CBT 
oa2(z) = 0.25 十 zl n=50 

线性 78.4 82.0 82.4 73.8 
非 参数 h = 0.32 81.4 80.8 77.2 
as(z) = 0.25 + 4(z1 — 0.25)? 

线性 92.4 99.8 99.6 97.8 
ABM h = 0.32 99.8 99.8 99.2 
o4(x) = 0.25 exp(x1 log 5) 

线性 95.2 98.4 99.8 94.4 
非 参 数 A = 0.32 98.6 99.8 98.2 
n=70 C&W NEW WBT CBT 
oa2(z) = 0.25 十 zl 

线性 90.6 93.2 93.2 89.2 
非 参数 h = 0.32 92.0 92.4 91.8 
aa(z) = 0.25 + 4(z1 — 0.25)? 

线性 94.4 100.0 99.8 99.8 
非 参 数 h = 0.32 100.0 100.0 100.0 
od(z) = 0.25exp(z1 log5) , 

线性 97.0 99.4 99.6 96.4 
ABH h = 0.32 100.0 99.4 98.6 





此 外 , 如 果 协 变量 是 一 维 的 ， 且 误差 服从 正 态 分 布 ，Eubank 和 Thomas (1993) 
检验 在 原 假设 下 的 渐 近 分 布 是 自由 度 1 的 卡 方 分 布 ， 他们 的 检验 定义 为 加 权 残 差 
平方 和 的 形式 , 也 属于 Cramér-von Mises 类 型 的 检验 . 统计 基 需 要 选择 权重 函数 . 
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为 了 得 到 较 好 的 检验 功效 ， 权 重 函数 的 选择 和 备 择 假设 有 关 . 在 他 们 的 模拟 中 ， 
选择 三 种 形式 的 权重 函数 ， 相 应 的 统计 量 分 别 记 为 Ti, To 和 Ts. 本 章 分 析 四 种 不 
同形 式 的 方差 函数 ， 即 vo(x) = 1, r(x) = exp(z), v2(x) = exp(z2?) 以 及 va(z) = 2 
如 果 x > 0.5 ， 否 则 wa(z) = 1 ， 1000 次 试验 拒绝 原 假设 的 百分比 见 表 7.5. FF 
本 大 小 n = 100 和 n = 200. 考虑 了 两 类 回归 函数 $1(z) = 3+ 2.7z + 3x? 和 
gd(z) = 3exp(—2x). 类 似 于 Eubank 和 Thomas (1993) 第 149 页 NT 和 To 检验 结 
果 ， 渐 近 检 验 对 回归 函数 的 选择 并 不 敏感 ， 所 以 表 7.5 只 给 出 回归 函数 是 内 ， 
窗 宽 h = 0.32 时 的 模拟 结果 . 

















表 7.5 Ho 被 拒绝 的 百分比 








方差 函数 vo vi v2 v3 
n=100 5.4 46.0 46.3 51.0 
n = 200 5.0 76.5 78.0 82.0 


在 原 假设 下 , 渐 近 检验 的 结果 和 给 定 水 平 很 接近 . 然而 正如 Eubank 和 Thomas 
(1993) 所 指出 的 ,在 n = 100 时 他 们 的 检验 很 难保 持 临界 水 平 . 在 相同 的 情况 下 ， 
To 比 渐 近 检验 对 备 择 假 设 更 敏感 . 

总 结 起 来 ， 如 果 协 变 基 是 一 维 变量 上 且 。 和 X 独立 ， 检 验 的 渐 近 分 布 的 临界 值 
通过 查 表 可 得 ， 此 时 可 考虑 用 渐 近 检验 的 方法 ， 否 则 ， NMCT 方法 值得 推荐 . 


7.5 定理 的 证 明 


7.5.1 ERE 

为 了 证 明 7.2 和 7.3 小 节 中 的 定理 ， 首 先 给 出 一 些 条 件 . 

(1) 存在 非 零 的 整数 mi,… ,ma ， gle) = O(a) f(z) 和 f(z) 关于 r 的 第 i 个 
分 其 mi 为 mi 次 可 微 . im =m. tma, g fm KERER: F 
在 原点 的 邻 域 ， 不 妨 记 为 0 ， 以 及 常数 c > 0 ， 对 任意 ueU， 

[FOP (a +u) — Fo) < clu], 
g(a + u) — g™(2)| < elu. 


(2) ElY|* < 00 和 HRI <%. 

(3) 连续 核 函 数 K(-) -ü KOC) 满足 条 件 : 
( 
( 


a) 对 i=1,.…,d，, KOO 的 支 集 为 区 间 [ 1,1]; 
b) KO() 关于 0 对 称 ; 
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(c) Ji, KO (udu = 1, ft, WKO (u)du = 0,1 =0,---m;, i= 1,...d. 

(4) 4 n> co ft, hona, HPE c WE 1/(4(m+1)) < cl < 1/24) E 
d<2(m+1), FS “~” 表示 两 个 量 有 相同 的 收敛 速度 . 

(5) 0 < cı < inf f(x) < sup f(z) < c2 < oo. 

注释 7.5.1 条 件 (1) 是 关于 z 的 密度 函数 和 回归 函数 d(x) 的 光滑 度 的 要 
R. 条 件 (2) 为 了 证 明 Th 和 Wy 的 渐 近 收效 性 ， 在 满足 条 件 (4) 的 情况 下 ， 定 理 
7.2.2 中 Tn 的 渐 近 性 不 依赖 于 窗 宽 户 的 选择 ， 即 户 的 选择 相对 比较 灵活 ， 比 如 在 
一 维 的 情况 ，d = 1 ，m =0 时 ， 包 的 变化 范围 为 n- 到 n-* ， 包含 了 最 优 收 
SRB h= opn). 从 这 个 意义 上 讲 ， 统 计量 Wr 对 光滑 参数 h 的 选择 并 不 是 很 
HR. RH (5) 是 为 了 避免 边界 效应 问题 常用 的 条 件 . 

接 下 来 的 证 明 针 对 协 变量 是 一 维 的 情况 ， 类似 的 证 明 可 以 推广 到 多 维 的 情况 . 


7.5.2 第 7.2 节 中 定理 的 证 明 

证 明定 理 7.2.1 正如 上 述 所 提 到 的 , 假定 x; 是 一 维 变量 . 由 于 SS 依 概 率 
RX, sup, |Fn(z) 一 F(z)| = op(1/VR) , RAW £; = (c;-€)-(G-B)(xj-a), 2 = 
(cj ~€)? — AÊ- 8)(a; — 2)(ej - 2) + (8 8)? (z; -2)?, (E-— EX) = op(1/ V7), bh 
K E= op(1/ vm), Hi 


Ta(2) = a De? = o?)(I(z; <2) - F(x) 
j=1 
-30-0 Lote ~ EX)(I(a; < 1) ~ F(2)) 


+zô- 9)? > (z; ~ EX)?(I(z; < 2) — F(2)) + op(1/ Vn) 


j=l 


=: h(x) ~ In(x) + I(x) + op(1/ Va). (7.5.1) 


由 所 有 z 为 指标 集 组 成 的 函数 族 sei 5 US < x)—F(c)) 属于 VC 族 (Pollard, 
1984; Giné, Zinn, 1984), (1/n) $` a < 2)—F(2)) > E(X?(I(X < 2)-F(c))) 
j=l N 


几乎 处 处 关于 z 一 致 成 立 (Pollard, 1984, p25) ， 则 Lax) = op(1/Vm) 几乎 处 处 关 
于 z 一 致 成 立 ， 由 所 有 z 为 指标 集 的 函数 ， 族 As(X) = Xe(I(X < x) — F(z)) 
也 是 VC 族 ， 因此 本 度 引 理 (Pollard, 1984, p150) 成 立 ， 根 据 定理 VII 21 (Pollard 
(1984, p157)), 1/Vn me ejtjI(zj < 2) 弱 收 敛 到 中 心 化 的 Gaussian 过 程 ， 所 以 
hlz) = op(1/ Yn) 几乎 处 处 关于 Z 一 致 成 立 . 根据 Pollard (1984) 的 定理 VII 21, 
以 及 Cn 一 O 依 概率 成 立 ， 五 弱 收敛 到 式 (7.2.5) 的 过 程 By. 根据 这 个 结论 ， 在 定 
理 7.2.1 的 条 件 下 ， 由 连续 映射 定理 ， Wa US W. 定理 证 毕 . 
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证 明定 理 7.2.2 类 似 于 式 (7.5.1) 关于 Tr 的 分 解 ， 有 


T(z) = wad LE -Pa <2) - Fle) 


-5 Lale -sede < 2) = Fl) 
+ Le (23) — 9(23))*U(@; < 2) — F(z)) + op(1) 
=: I4(a) — Is(x) + 16(z) + op(1). (7.5.2) 


接 下 来 只 要 证 明 五 和 五 依 概率 收敛 到 零 . 
KF Ie, 有 


sup [e(2)] < -z HDi- $(2,))?. 


vn 


ERPF Vn RU 6 HIGHT. 在 7.5.1 节 的 条 件 下 ,不 难得 到 由 的 均 方 误 
差 等 于 op((1/V + h™+1)*), 因此 16(z) = op(L/V + Vnh*"+)) 关于 2 一 臻 
成 立 . 
接 下 来 证 明 石 关于 z 一 致 依 概率 收敛 到 零 ， 通 过 一 些 初等 计算 ， 
Ba) — g(a) = 92) _ 90) 
$(x) — $(x) = fi) f@) 
_ 92) - 92) _ f(x) = f(z) 
= Fe) Fay 
-CO = go) Fa) - FO) , HOF@)-~ FO 153) 
F(a) F(a 六 F(x) f(z) 





类 似 于 计算 估计 6(z) 的 均 方 误差 ， 根 据 条 件 (1)~(3) ， 可 得 


D (la) - (a)? = op((logn)4/(nh) + Ntn+D)， 


ce 
Ul 


(F(a) - F(@))? = op((logn)4/(nh) + 2™+Y), 


Me: 


X. 
il 


aX (7.5.3) 和 条 件 (5) , 
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b) = FL le <2) ~ F(a) 


-Ses(ve (a pied ID), < 2) — F(e)) 
j=l 
+0p((logn)*/Ynh + Vrih2"*»)) 
=: Jala) — Ja(a) + op((logn)4/ Vath + Vane4), (7.5.4) 


接着 证 明 上 式 J 和 J 依 概率 关于 z 一 致 收敛 ,由 于 对 这 两 项 的 证 明 过 程 类 似 ， 
只 给 出 J 的 证 明细 节 . 
记 





Wilen ayuena) = HEE ED DAE a, < 2) - F(a) 


不 难得 到 ， 


1 Š 1 
A(x) = Bae De ens) + WÀ (a,ir 45,6602) + On RF) 


=: Ji (a) +f) (7.5.5) ` 
iE n= (Ke), BK 
Walnisnj.2) = A(Wi (nis ms 7) + Wà (mm 2)) 
-h (EW (nn; 2)h)) + EWA (usm, 2)m))), 


其 中 ， E(Wi(n,nj,2)|nj)) 是 给 定 n, Wh 的 条 件 期 望 ， 定 义 
J= zaa Wn) 
ižj 


则 Jı 为 U 过 程 (Nolan, Pollard, 1987). 由 于 示 性 函数 构成 的 函数 族 属于 VC 族 ， 

对 任意 c, B Wilz) 可 以 看 作 中 心 化 的 示 性 函数 (7(- < x) 一 F(z)) 与 独立 了 
给 定 函 数 的 乘积 ， 对 任意 固定 n ， 函 数 族 Ga = {Wi(-,7) : x e R} 为 实 函数 的 

向 基 空 间 ， 它 的 维 数 等 于 由 所 有 示 性 函数 组 成 的 空间 . 由 于 EW, m r) = 

Gn 为 P 退化 的 且 包 迹 为 


Gn(m, n2) 
K (E T) -ofos)p(zsjes 
f(x2) 


(ok ( E=) — (ar) o(ar)er 


f(z1) 
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根据 Nolan 和 Pollard (1987, p786) 的 定理 6， 
Esup| >> Wi (mm,7)| < cE(an + YnIn(On/Yn))s 
ij 





其 中 ， 
Jn(s) = f lg Nale Ta Gns Gn), 
0 
Yn = (TG), an = + sup (Tug2)12， 
4 geg, 
(7.5.6) 
对 任意 函数 9 ， 
Tag? := YO gmim) + 9?(mriv nj-1) + 9?(Mri—-1,023) + 9?(M2i-1, 29-1) 


ižj 

其 中 ， Nol, In Gn, Gn) 表示 在 Lo 距离 ， 测 度 Th, WE Gn 时 9 AEREA. 由 
于 Gn 为 VC 族 ， 根据 逼近 引 理 II 2.25(Pollard, 1984, p27) 的 证 明 过 程 ， 可 得 存在 
MASE nA Ty 的 正 数 和 wi , BERK Nz(uTh/n2G2， Th/n2, Gn, Gn) 不 大 于 cum. 
又 因为 对 足够 大 的 nn ， 下 式 依 概率 成 立 : 

ca i se/ (yi ((wi — z4)/h) ~ g(zi)) (es )e5 y2 

Teh <2) 2 fe) ) 

= O(hn? log? n) a.s. 





j=1 i=1 


所 以 ， 对 足够 大 的 n, Ta/n?GZ 小 于 1 A No(u,Tn/n?,Gn,Gn) < cu™. 由 于 
No(u, Tn, Gn, Gn) = No(u/n?, Ta/n?, Gn, Gn) ， 则 


In(On/m) < In(1/4) 
1/(4n?) 
= n f lg No(u,Tn/n?,Gi,G)du 
0 


1/(4n2) 
= =n? f Igudu 
0 


= clogn, 
以 及 
72 = TG? = O(hn? log? n) a.s.. 
所 以 ,对 足够 大 n, E supe |; ; Wami nj, £)| < eVhnlogn, ‚XH E sup, |J} (2) < 
cVhlogn/ Vn, 以 及 


I= hy SLEW (n 15,2) |ng) + op(Vhlogn/ vn). (7.5.7) 
j=1 
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等 价 地 ， 
FAm nj, z)ini) + opllogn/Vnh) 


= pn -glz K(X — Alz) <2) = FO) 725) 


+ op(logn/Vnh) 
=: Ja(x) + op(logn/Vnh). (7.5.8) 


由 第 7.5.1 节 条 件 (1) 和 (3) ， 对 任意 zj, 


BY ~ g(z;))Ka(X — 2) = B(g(X) — g(2))Kn(X ~ 23) 
= E(g (ar) + hu) — g(z;))K (u) = O(h™), 





Var(E((Y — g(23))Kn(X — z;)ġ(z;)(I (z; < £) 一 FOF) 
nes O(h2(m+D). 


根据 Zhu (1993) 的 定理 3.1 ， 或 者 类 似 定理 IL.37(Pollard, 1984, p34) 的 证 明 过 程 ， 
可 得 
sup |Js(a)| = O(h?™+® (log n)?) a.s., 


联合 式 (7.5.5) 、 式 (7.5.8) 和 条 件 (4) ， 得 出 定理 的 结论 . 

ide 7.2.1 如 果 Ele 一 o?)?|X) 为 常数 ， 则 等 于 C?. 通过 变换 ， 可 得 
W = fy B(a)?dx, 3} B X [0,1] 上 的 Brownian 桥 . 

ee 7.2.3 J$ Ta 的 分 解 ， 不 难 证 明 式 (7.5.1) 或 式 (7.5.2) 成 立 ， 用 定 
理 7.2.1 或 7.2.2 的 证 明 方 法 可 得 五 和 五 (或 者 石和 16) 渐 近 趋 于 零 , 对 五 (或 者 
u), 有 


h(a) = Fe Le - (0? + s(x) /n*))(I(a <2) - Fle) 


ni/2-a 于 
= DEU < x) — F(z)). 
j=1 
上 式 第 一 项 求 和 弱 收 剑 到 Bl ;第 二 项 收敛 到 无 穷 或 者 定理 7.2.3 中 的 SF ， 分 别 
对 应 于 0<a< 1/2 a= 1/2 两 种 情况 . 


十 
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7.5.3 第 7.3 节 中 定理 的 证 明 _ 
证 明定 理 7.3.1 首先 在 线性 模型 的 情况 下 计算 Ti，， 类 似 于 Th, To 可 分 解 为 


Tale) = LEPU <2) - Fale) 
j=1 


n 


ss ~ Z)(I(z; < x) — Fn(z)) 


He ô) E 
+e- Èe - 2)?(I(æ; < 2) — Fa(2)) + op(1/Va) 
=: I} (2) — (2) + I (2) + op(1/ V). (7.5.9) 


由 产生 自助 数据 的 过 程 ， 给 定 原始 数据 ， 上 为 均值 零 的 独立 数据 ， 如 果 可 证 及 
SWC, 根据 (8* - B) = op(1/Vn), (8" — BIS RRA op(1/Vn). th I3 AY 
定义 ， 不 难 证 明 (8* - Ê KWRA op(1/ Vn). BER IES MLE EA FEA 
{a1 入) (Zn Yn) }. TS 弱 收 敛 到 中 心 化 的 Gaussian 过 程 Jo, SER zx 和 
z1 ， 了 2 的 协 方差 函数 是 o2E((X -EX)?(I(X < x) — F(x)(I(X <a) - F(x). 

首先 ， 不 难 验证 Ty 的 协 方差 函数 收敛 到 I 的 协 方差 函数 ， 根 据 定理 VI 21 
的 证 明 (Pollard, 1984, p157~159) ， 或 者 类 似 Zhu (1993) 中 定理 的 证 明 ， 只 需 验 
证 本 度 引 理 (Pollard, 1984, p150) 的 条 件 (16). 注意 到 由 所 有 z 为 指标 集 的 函数 族 
(X — BX)é*(I(X < 2) — Fy(z)) 属于 VC 族 ， 因 此 本 度 引 理 的 条 件 (16) 成 立 ， 所 
以 条 件 过 程 Tf SS) B ， 定 理 的 结论 对 线性 模型 成 立 ， 对 非 参数 回归 函数 ， 
Ta 渐 近 等 于 线性 模型 时 的 太 ， 类 似 的 证 明 可 得 定理 结论 . 

证 明定 理 7.3.2 注意 到 模型 中 ÂA È 的 收敛 性 质 , 不 难得 出 Th (Bn) 的 协 方 
差 函数 收敛 到 T 的 协 方差 函数 , Th (En,-) 的 有 限 分 布 fdis 收敛 也 成 立 . 因此 , 只 
需 证 明 Tr (En, +) 的 一 致 紧 性 成 立 . 记 gn(X,¥,t) = (€ -—0°)(I(X < t)-Fr(t)), A 
{(21, y1), + (Cn Ym)} REX L? (Pr) Fi dn (t,s) = VB(gn(X, t) — mX, Y, 5)} , 
其 中 ， Pa 表示 基于 (1,92). (En Yn)} 的 经 验 测度 ， 即 对 任意 (X,Y) 的 函数 
Fo Paf(X¥) 为 F(X Yi) F(Xn Yn) 这 nn 个 值 的 平均 数 . 关于 一 致 紧 性 ， 
需 证 对 任意 ”>0 和 «>0, 存 在 5>0 满 足 





lim sup P{sup [Tn (En, t) — Tn(En,s)| > nNXn, Yn} < €, (7.5.10) 
n= 加 


HH, [8] = {(t,8) :dn(t,s) <8}, (Xn, Yn) = {(21; 71) s (Ens Yn)}- 

由 于 我 们 所 关心 的 是 n 一 so 时 变量 的 极限 性 质 ， sro 总 假定 
n 足够 大 . id g(X,Y,t) = (€ — 0?)(U(X < t) — Fr(t)), G = {9(,t) :te RÌ} 以 及 
d(t,s) = V/Prlg(X,¥.t) — oY. 5) )?. 根据 线性 模型 中 S 和 非 参数 模型 中 4 的 收 
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SHE, Supis ldn(t, s) — d(t, s)| 一 0 依 概率 成 立 ， 因此， 对 足够 大 
P{sup |Ta(En: t) — Ta (En, 8)| > n| Xn, Yn} 
< P{ sup |Tn(En,t) — Ta (En, 8)| > n|Xn, Yn} (7.5.11) 
<25> 
其 中 ，< 26 >= {(t,s): d(t,s) < 26}. 


为 了 应 用 链 引 理 (Pollard, 1984, p144) 的 结论 , 需 验证 下 述 两 个 条 件 是 否 成 立 ， 
即 


P{|Tn(En,t) — Ta (En, s)| > nd(t, s)|Xn, Yn} < 2exp(—n?/2), (7.5.12) 


Jo(5,d,G) = / “(210g{(Na(u, d,G))? /u}} du. (7.5.13) 
0 


对 某 些 5 > 0 APR. 对 任意 te A, FETE tr ,tm 满足 mimicicma(t,ti) <u, H 
盖 数 No(u,d,G) 就 是 满足 条 件 的 最 小 整数 m. 根据 Hoeffding 不 等 式 ， 式 (7.5.12) 
成 立 . 由 于 9 属于 VC 族 , 旦 存在 常数 c< 秘 ,满足 No(u,d,G) < cu” ,这 说 明 式 
(7.5.13) R. 根据 链 引 理 ， 且 Jo(6,d,G) < cul/? 对 某 些 c > 0 成立, 存在 < 26> 
的 可 数 稠密 子 集 < 25 >" ， 满 足 


P{ sup Vn|Ta(En, t) — Tn(En, s)| > 26cd™/?|Xn, Yn} < 2cô. (7.5.14) 
<26>° 


因为 Tn(En,t) 一 Tn(En,s) 关于 上 和 s 是 右 连续 函数 ， 可 数 稠密 子 集 < 26 >* 可 被 
< 26 > 替代 ， 又 由 于 式 (7.5.11) ， 选 择 足 够 小 的 5 ， 得 到 定理 的 结论 . 
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8.1 引 a 


纵向 数据 分 析 中 典型 的 特征 是 ， 个 体 在 不 同 的 时 间 内 被 重复 测量 ， 对 于 纵向 
数据 的 研究 ， 其 中 一 个 重要 的 目的 就 是 评价 响应 变量 与 协 变量 之 间 随 着 时 间 的 变 
化 关系 ， 对 于 纵向 数据 分 析 ， 由 于 已 有 的 参数 模型 对 于 数据 之 间 的 关系 有 很 大 的 
限制 ， 而 非 参数 模型 没有 具体 的 结构 ， 在 很 多 情况 下 ， 很 难得 到 生物 学 上 很 好 的 
解释 ， 近来， 用 变 系数 模型 对 纵向 数据 分 析 研 究 的 参考 文献 很 多 ， 其 中 ， Hoover, 
Rice, Wu 和 Yang (1998), Wu, Chiang 和 Hoover (1998), Fan 和 Zhang (1999), Wu 
和 Chiang (2000), Fan 和 Zhang (2000), Huang, Wu 和 Zhou (2002), Chiang, Rice 
和 Wu (2001), Wu 和 Liang (2004) 以 及 Huang, Wu 和 Zhou (2004). 

上 述 部 分 参考 文献 对 于 变 系数 模型 分 析 的 动机 来 自 AIDS 病人 研究 中 心 (Mul- 
ticenter AIDS Cohort Study) 的 一 组 数据 ， 这 组 数据 包括 ， 身 体 的 重复 检查 数据 、 
实验 室 结果 、CD4 细胞 最 ， 以 及 1984 年 到 1991 年 之 间 283 个 同性 恋人 是 HIV H 
性 的 百分比 ， 正 如 Wu 和 Chiang (2004) 提 到 的 ， CD4 细胞 其 和 百分比 ， 即 CD4 
细胞 基 占 所 有 淋巴 细胞 的 比例 ， 是 目前 对 HIV 感染 病人 身体 状态 检测 的 最 重要 指 
bo. 显然， 对 于 CD4 细胞 基 或 者 比例 做 统计 模型 非常 重要 ,响应 变 基 是 CD4 细胞 
Aik, 协 变量 为 个 体 的 吸烟 状况 ; 感染 HIV 病 时 个 体 中 心 化 的 年 龄 ; 感染 之 前 中 心 
化 的 CD4 比例 . 一 般 来 说 , 这 些 协 变 其 与 时 间 非 独立 . 然而 ，Wu 和 Chiang (2000) 
发 现 这 组 由 AIDS 病人 研究 中 心得 到 的 数据 的 协 变革 不 依赖 时 间 t. 事实 上 ， 文 献 
Hoover, Rice, Wu 和 Yang (1998) 的 第 5 节 中 指出 ， 在 很 多 情况 下 ， 如 流行 病 学 研 
究 ， 协 变 其 与 时 间 t 独立， 只 有 响应 变量 Y 和 时 间 相 关 , 而 且 ，Hoover Rice, 
Wu 和 Yang (1998) 的 实例 分 析 中 所 用 的 例子 也 属于 协 变量 与 时 间 独 立 这 一 特殊 情 
况 ， 对 于 这 种 情况 ， 也 可 以 参考 文献 Chiang, Rice 和 Wu (2000). 因此 ， 关 于 变 
系数 模型 的 很 多 实际 或 者 理论 问题 ， 在 协 变量 独立 与 时 间 的 情况 ， 值 得 进一步 研 
究 ， 正如 Wu 和 Chiang (2000) ， 协 变量 不 依赖 于 时 间 的 变 系数 模型 可 以 通过 下 式 
表达 : 








Y(t) = X7 B(t) + e(t), (8.1.1) 


Ht, X= (1, 久 中,… XM), XOQ = 1,… ,k) 是 独立 时 间 的 协 变量 ， B(t) = 
(po( Bel) E B.(t) t 的 光滑 函数 ， =(b 为 0 均值 的 随机 过 程 ， 晶 方差 和 协 
方差 分 别 是 Var(e(t)) = 07(t) 和 Cov(e(t),<(s)) = pe(t,s) ;假定 XO,- , XO 是 





81 引 È 108 





随机 变量 ， 本 章 中 关心 的 问题 是 : 检验 模型 式 (8.1.1) PHM ERA Bi 
足 某 种 参数 形式 ?也 就 是 ， 在 原 假 设 下 , 对 1=0,1,…,k， Gilt) = A(t, 1). 

对 于 本 章 中 所 关心 的 问题 ,纵向 数据 包括 时 间 , 依赖 与 时 间 的 响应 变量 了 (b) , 
以 及 与 时 间 独 立 的 协 变 基 X = (XO, XO), XB XO 取 值 范围 是 实数 ， 类 
似 于 一 般 的 线性 模型 包括 截 距 项 ， 这 里 ， 令 XO = 1 ， (Yij, Xt) RRIF n 
个 独立 个 体 ， 第 i 个 个 体 的 第 j 次 观测 ， 其 中 ， X = (XGO xX) x =1 
(7 = 1,2,… ,mi). 假定 Xi 是 独立 同 分 布 的 随机 变量 ， 分 布 函数 为 Fx ， ty 是 分 
布 函数 是 F 的 独立 同 分 布 的 随机 变量 ， 且 对 于 任意 t+， X 和 elt) 独立 . 

对 模型 式 (8.1.1) ， 如 果 XX) 可 逆 ， 6(.) 可 以 被 唯一 确定 ， 且 

















B(t) = (E(XX7)) “1 (XY 人) (8.1.2) 


上 述 解 也 可 以 参考 文献 Hoover, Rice, Wu 和 Yang (1998). 如 同 前 面 所 述 , 检验 
的 问题 是 , 在 原 假设 下 , 对 于 第 r(0 <r <k) 个 分 量 ，B.(-) = Br(,91) ,也 就 是 , 对 
于 任意 7(0<r<k), i Br(8r) = {8-(.) = 2-( 0+); 0r € On} 定义 在 :Rdr(d > 1) 
WFR ©, 上 的 一 族 参 数 函 数 . 如 果 关心 的 系数 函数 为 8.(.) , 检验 问题 可 以 写成 : 
在 原 假设 下 ， 


Ho : Br(-) = B-(-, Or) Xt HALO, € Or; (8.1.3) 
在 备 择 假设 下 ， 
Hi : B,(-) # Br (-, 0, TERA, € O,. (8.1.4) 


在 现 有 的 文献 中 ,对 于 独立 样本 的 检验 统计 其 已 经 有 很 多 研究 ， 大 体 上 讲 ， 主 
要 有 两 类 方法 做 检验 . 一 类 是 基于 对 非 参 数 回 归 函数 局 部 光滑 的 方法 , 见 Hirdle 和 
Mammen (1993), Hart(1997) 是 关于 这 个 方法 比较 全 面 的 参考 书 . 另 一 类 方法 是 基于 
残 差 标志 过 程 的 全 局 光滑 方法 ， 见 参考 文献 Stute(1997), Stute, Theis 和 Zhu(1998) 
以 及 Stute 和 Zhu (2002, 2005). 

对 于 本 章 中 所 研究 的 模型 拟 合 优 度 检验 ， 我 们 采用 全 局 光滑 的 方法 构造 检验 
统计 量 , 由 于 的 取 值 在 实数 空间 ， 可 以 采用 Stute, Theis 和 Zhu (1998) 提出 的 更 
新 方法 ， 通 过 这 种 方法 ， 可 以 构造 具有 某 些 最 优 性 的 检验 统计 量 ， 见 Stute (1997) 
和 Stute, Thies 和 Zhu (1998). 而 且 ， 在 本 章 中 ， 也 考虑 用 非 参数 蒙特 卡 罗 逼 近 检 
验 统计 量 在 原 假设 下 的 分 布 . 与 自助 法 逼近 原 假设 下 统计 量 的 渐 近 分 布 相 比 , 非 参 
数 蒙特 卡 罗 副 近 所 用 的 计算 其 相对 较 少 , 而 且 在 传统 的 回归 模型 中 , 被 证 明 具有 很 
好 的 性 质 ， 见 Zhu (2003). 值得 一 提 的 是 用 这 两 种 方法 检验 本 章 中 的 问题 并 不 是 显 
而 易 见 的 , 因为 纵向 数据 中 模型 的 结构 比 传统 回归 模型 的 结构 要 复杂 得 多 . 所 以 ， 
检验 统计 量 的 构造 和 统计 基 的 性 质 需要 仔细 推导 . 
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8.2 统计 量 的 构造 


记 (BAX)! 的 第 (+ LT) MEn, Z= B(OH), Ze = 
ZirYij. 根据 式 (8.1.2) ， 可 以 得 到 ， Xr =0,1,---,k, 


Br(t) = E{Zijrltij = th. (8.2.1) 


在 原 假设 下 ， 存 在 0, EO., THA B(-)=8,(-,0r), BI B{(Zijr — Br (tig, r)) {tig = 
t}=0 (i= 1,2,… ,n;j = 1,2,… ,mi) ， 重 新 整理 后 可 得 

Zijr = Br(tij,0r) + ei (i=1,2,.,n;j= 1,2,.. ,mi). (8.2.2) 
其 中 ， Eleijltij) = 0. 在 模型 (8.2.2) 中 ， 假 定 Var(eijltij) = o?(tij) AR. E 


假设 下 ， 对 所 有 t，E{(Zijr — Gr(tiz,8r))|tiy = t} = 0 EMF R(t) = B{(Ziyr 一 
Br (tig Or))I(ti; < t)} =O, 所 以 


T= / R(t)?dF(t) =0, (8.2.3) 
SoH, FA ty 的 分 布 函数 ， 显 然 ， 检 验 统计 量 可 以 基于 R(.) 的 经 验 形式 得 到 . 
WEN = Yo mi. 如 果 Zir 和 Belts 0) BA, RO 的 经 验 形式 是 R(t) = 
yay È {(Zijr 一 Br(tij. Or) (tig <H}; BWM, R(t) 的 经 验 形式 为 Rw(t) = 
AS 2 Êi = Br (tig, Ox) (tig < 四} ， 其 中 ，0w 和 ijr 分 别 是 0, 和 Ziy 
的 估计 ， 本 章 中 ， gw 表示 0; 的 最 小 二 乘 估计 ， 也 就 是 


On = arg min 去 > J (Zie — B,(tiz,0))?. 


i=l j=1 


oh Ack 2 x Ss xO 
WE == SOXXT, ên 表示 六 -的 第 (141) ASM, Zu = SEX), 
i=l 0 


{= 
jr = ZYiy. 
定义 如 下 的 检验 统计 基 : 
Ty = / Rw(t)2dFw(t) = x EF Rw lt)? (8.2.4) 


i=l j=1 


其 中 ， Fy {tj (i 二 1,2,… ,mn;j = 1,2,… ,ms)} 的 经 验 分 布 从 上 面 的 分 析 中 
不 难 知道 ， 如 果 Tw 的 值 较 大 ， 应 该 拒绝 原 假设 Ho. 
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8.3 统计 量 的 渐 近 性 质 


首先 引出 基于 Jennrich (1969) 的 一 个 命题 . 
命题 8.3.1 在 原 假设 Ho F, 假设 下 面 的 正则 条 件 成 立 : 
(i) 响应 变量 Zijr 具有 如 下 结构 : 


Zijr = Br(tij, Or) + ei(i = 1,2,- ,n;j = 1,2,--- ,mi), 


KP, Al) 具有 某 种 参数 形式 ， 是 定义 在 Euclidean 空间 的 子 空间 O, 上 的 连续 
HH, cij 是 独立 同 分 布 的 误差 ， 且 均值 为 0, 方差 o2 > 0 AM, 0, 和 o? Rte, 
(ii) 6-(0) = {Br(tij,0) :i=1,2,… ,mn;j =1,2,--+ mi} 的 尾 交叉 乘积 存在 ， 且 
Q(0) = |6-(9) — Br(0r)|? 有 唯一 的 最 小 值 点 O = gr. AR AMARA RX Jennrich 
(1969). 
(iii) 记 


8) = (PEGE a tyne sng = Ayers smi} = Ayo dy 


Br, (8) I thi 
Br, (0) 和 Bri,(0) 存在 且 在 Or 连续 ， [fh] 的 尾 交叉 乘积 存在 ， 其 中 ， fh = 


Par P O) BaO 
28-0) 


=E 


Seto 4), 


EERI Nè (ON — Or) 依 分 布 收 敛 于 中 心 化 的 正 态 分 布 ， 分 布 的 方差 
A oa" (Op). 

为 了 证 明 Ry 的 收敛 性 ， 给 出 如 下 的 正则 性 条 件 : 

(i) B.(tij,9) 关于 er 的 内 点 9 连续 可 导 . 

(i) 记 


g(tij,0) = grada (8, (tij, 0)) = (91 (tij: 0), +++ ,ga, (tij, 0))7. 


假 定 对 于 所 有 be O,, |gi(tiz,0)| < M(tj)(1<i<d), HH, MÆ FIR 
函数 ， 

(iii) 对 任意 9 € On, oi(ti)lgi(tij,90)| < M(tis) (1 < i < d), HR, 
o? (tay) = Var{(Z,(t) — B,(t))|tis}- 

记 G(x,6) = fZ o 9(u,0)F (du). 接 下 来 的 定理 给 出 Rv 和 Ta 的 收敛 性 质 . 
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定理 8.3.1 在 原 假设 Ho 和 条 件 4 下 ， Ry ={Rn(t):t € R!} 在 Skorohod 

空间 D[—00, +00] 中 依 分 布 收敛 于 过 程 
Ro = B-G"(2,6,)N, 
其 中 ，B 是 中 心 化 的 Brownian 运动 ， 协 方差 函数 为 Cov(B(z1), B(xz2)) = Y(t A 
z2), HP p(x) = Var(Zijrltij = t)F(dt),tij ~ F, N 是 均值 为 0， 方差 

是 PaO) 正 态 分 布 向 量 . 由 Ry 的 收敛 性 ， 不 难得 到 Ty 依 分 布 收敛 于 T = 
J Reo(t)dF(t). 

TR, Ty 和 了 的 分 位 点 很 难得 到 , 因此 , 为 了 确定 统计 量 的 渐 近 临界 值 点 ， 
可 以 用 重 抽样 的 方法 逼近 得 到 临界 值 点 ， 或 者 基于 Ry ， 定 义 检验 统计 量 ， 统 计量 
的 分 布 或 者 渐 近 分 布 的 临界 值 点 通过 查 表 就 可 以 得 到 , 接 下 来 的 两 小 节 , 分 别 介绍 
两 种 方法 得 到 临界 值 . 
8.3.1 更 新 过 程 的 方法 

首先 引出 Ry 和 Ry 的 刻度 不 变形 式 ， 即 

RO = NE SS Itsy < tho (t45)(Zage Bo) 


i=l j=1 
和 
R(t) = NPS ty < ba (ti)(Zisr — Br(tij, ON)). 


i=l j=l 


用 证 明 Ry 的 收敛 性 给 的 正则 性 条 件 Gii) 替代 Gi), 可 得 RACE) 依 分 布 渐 近 收敛 于 
过 程 Bo, HEH, Bo 是 中 心 化 的 Brownian 运动 , 协 方差 函数 是 Cov(Bolt1), Bo(tz)) = 
P(t Ate). EEL, RRE) 依 分 布 收敛 到 过 程 Bo - Golt,0,) No, HH, 


t 
Go(t.6.) = f o= (s)gls,0,)F (as) 


E No 是 标准 正 态 向 量 . 

关于 Bo - Go(z,0,) No ， 首 先 通过 变换 把 Bo - Go(z,9.)"No 转化 为 Bo. 也 就 
是 ， 做 线性 变换 L, ERMIR LB = Bo H L(Golz, 0) No) =0. 接 下 来 ,给 
出 变换 L 的 表达 式 ， 另 


+00 
A= f alt,6,alt.6-)"o (Fat) 
是 dx 4d hERRME. TERR SEX 
(EAI) = 18) = f Oga [ J ariga ods)| F(t). 
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对 于 这 个 算 子 工 ， 很 容易 证 明 L(Gols,0-) No) = 0. 由 于 L 是 线性 算 子 ， LBo 为 
中 心 化 的 Gaussian 过 程 ， 为 了 证 明 LBo = Bo ， 只 需 说 明 下 式 成 立 : 


Cov(LBo(r), LBo(s)) = Cov(Bo(r), Bo(s)) = F(rAs). (8.3.1) 


式 (8.3.1) 的 证 明 过 程 将 在 第 8.5 节 中 给 出 . 
定理 8.3.2 在原 假设 下 ， 在 条 件 4 ， 以 及 命题 8.3.1 中 的 条 件 下 , 假定 4(z) 
HFE TË, RARA 


L(Bo — Go(z, 0)” No) = L(Bo) = Bo, (8.3.2) 


且 在 Skorohod 空间 D|-o0, +00] +, LRY 依 分 布 收敛 于 Bo. 

从 统计 应 用 的 观点 ， 如 拟 合 优 度 检 验 ， 定 理 8.3.2 中 的 RY 和 工 仍然 包含 有 未 
知 的 量 ， 如 07(tig), Or 和 F(tij). 对 于 给 定 的 数据 ， 为 了 使 用 上 述 所 提出 的 方法 ， 
所 有 的 未 知 基 需要 用 估计 代替 ， 如 变换 工 用 它 的 经 验 形式 Ly 替代 ， 对 于 替代 后 
的 式 子 ， 需 证 明 它 与 LRY 有 相同 的 渐 近 性 . 

在 同方 差 时 , 只 要 用 op Ry 代替 RY , 其 中 o% 表示 均 方 残 差 . 但 是 , 在 一 般 的 
异 方差 情况 , 待 估计 的 是 函数 07 (tiy) ， 而 不 是 常数 0. 因为 o2( (tis) = F{Z2,,|tiy = 
t} = Br(tig)? ， 任 意 相 合 的 非 参 数 估计 都 可 以 作为 条 件 二 阶 距 的 经 验 估计 ， 在 原 假 
BE Ho F, Br (tig)? 估计 可 为 Blij ON)? 对 0?(tiz) 在 某 些 严 格 的 光滑 限制 下 ， 
被 估计 替代 之 后 仍然 可 以 检验 本 章 中 感 兴趣 的 问题 ， 下 面 给 出 一 个 更 好 使 用 的 方 
法 ， 把 所 有 的 样本 {(tiy, Zir) (i = 1,2,… mj = 1,2,… ,mi)} 分 成 两 部 分 ， 记 
51,52. 假定 Si = {(ti, Zijr) ii = Lee nj = Dm} S2 = {(tij, Zir) : 
i=m+l oc mj= lom}, Sy 和 S 的 样本 量 分 别 为 Ni = Sm 和 


M= È m ， 假 定 当 N 一 oo 时 ， Ni 和 No 都 趋 于 无 穷 , 由 第 一 组 样本 得 到 
o2(t5) EIT, H ok, (tiy). 检验 统计 量 的 过 程 基 于 第 二 组 样本 得 到 ， 也 就 是 


mi 


Ry(t) = Nz? 5 D ty < Pon (tis) [Zisr — Br (tig, Or)], 


=n 41 j=1 


RY(t) = Ny? x Fre < tho! (ti)[Zisr — Br(tiy, On, )]. 


i=nitl j=1 
最 后 ， 转 换 Ly 定义 为 


3 +00 
UNOHO- f or OONA] ST TEO 0wa] Fr (dn) 
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其 中 ， Fw, 是 {Zim (tij Zir) € So} 的 经 验 分 布 ， 估 计 On, 和 Zijr 根据 样本 
{Zir (tij, Zigr) € So} 计算 得 到 ， 且 


Am(®) = fo low gt On, on (Fat) 





为 了 说 明 把 样本 分 成 两 组 后 的 影响 ， 注 意 到 给 定 第 一 组 数据 5; ， RN 是 独立 的 中 
心 化 的 过 程 ， 其 方差 函数 是 


Kins) = [T POR OFO 


在 一 定 的 条 件 下 ， 
sup,,,2|Kwn, (r,s) — F(r A s)| +0 (8.3.3) 
综合 上 面 提 到 的 独立 和 ， 有 
RN(t) 一 Bo 依 分 布 . 


对 于 Ly 中 的 on (t), Qizr 的 平方 可 积 这 一 条 件 保证 cg (t) 存在 全 局 相合 估计 满 
足 ， 


E J lo, (t) — oR (t)|F(dt) +0, as. Ny +00. (8.3.4) 


对 于 协 方差 函数 Ky, 的 收敛 性 ， 需 要 假定 存在  ， 满 足 0? (t) > a > 0. 
定理 8.3.3 在 定理 8.3.2 的 条 件 下 ， 假 定 条 件 (8.3.4) RÈ, Hoh, Ro? 一 
致 相合 估计 ， o 满足 0?(t) > a > 0. 在 原 假设 Ho 下 ， 有 


LNRN 一 Bo 依 分 布 在 D[—o0, +00] 成 立 . (8.3.5) 
上 述 过 程 的 收敛 说 明 Ty := (LNRN(t))?dFw(t) > f Bo(t)?d(t). 
8.3.2 NMCT 逼近 


Zhu 和 Neuhaus (2000) 提出 非 参数 蒙特 卡 罗 逼 近 检验 统计 基 在 原 假设 下 的 分 
Ai, 后 来 这 种 方法 发 展 成 为 一 种 普遍 适用 的 方法 论 , 见 Zhu (2003), Zhu, Fujikoshi 
和 Naito (2001) ， Zhu 和 Ng (2003) 以 及 Zhu (2005). 对 于 本 章 中 研究 的 这 种 特殊 
情况 ， 接 下 来 给 出 非 参数 蒙特 卡 罗 的 具体 应 用 .在 说 明 这 个 步骤 之 前 ， 首 先 引出 几 
个 表达 式 ， 在 原 假设 Ho 和 命题 8.3.1 的 正则 性 条 件 成 立 ， 有 


a cats 
N*?Oy — 6) = N2 Y $ U(tiz, Zijrs 0r) + Op (1) 


i=1 j=1 
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其 中 ，i(ti, Zij 0r) = È E (altij, atts. 80) Nats. 80) Zaye — Br (tig). 
ae 
记 I(Zr,T, Ort) = I(T < t)(Zr — Bp (T,Or)) — E((T < t)g(T, Or)" M(L, Zr, r) 5 
有 
Lam 
Ry(t) = DD DA + 0p(1). 
具体 算法 如 下 : 
步骤 1 ”产生 独立 同 分 布 的 , 有 限 支撑 的 随机 变量 eij(i = 1,… ,n;j = 1,… mi), 
且 随 机 变量 均值 为 0 ,方差 为 1. 在 本 章 的 具体 模拟 中 , 选取 ey 为 ，P(eij = -1) = 
P(eij = 1) = 1/2. 记 Ey := {ejj(i = 1,- nj = 1,… ,mi)}. 定义 相应 于 Rw 的 
条 件 部 分 





er ee 
‘Rye By) eee eijJ(Êijrs tij On, t). (8.3.6) 
N N ud ij iji ij ON 
相应 的 检验 统计 革 为 
Tw(Ew) = f R(t, Ew)PaFy(t). (8.3.7) 


HM 2 FA BAL Dy ， 不 妨 记 为 BR(i =1,---,B), BB) BF Ty(Ew) 
fA, WH Ty(Ey) (i= 1,- , B). 

步骤 3 p 值 估计 方 = h/(B+1), SP, ki 是 Tw(Bw)G 大 于 或 者 等 于 
Tvw(Bw) 的 个 数 ,给 定 水 平 a ， 如 果 万 < a ， 则 拒绝 原 假设 Ho. 

下 面 的 定理 给 出 非 参 数 蒙特 卡 罗 表 近 的 相合 性 . 

定理 8.3.4 在 定理 8.3.1 的 条 件 下 , 对 几乎 所 有 的 序列 {(CXi Vij, ti (i= 1,…， 
3 了 = 170i)} ， Ty(EN) 的 条 件 分 布 收敛 于 原 假设 下 Ty 的 极限 分 布 ， 

注释 8.3.1 正如 大 家 所 知 ， 传 统 的 自助 法 即使 在 传统 回归 模型 中 也 可 能 不 相 
合 ， 如 参考 文献 Stute, González 和 Presedo (1998). 就 本 章 所 研究 的 情况 而 言 ， 非 
参数 蒙特 卡 罗 检 验 类 似 于 Wild 自助 法 (Wu (1986); Mammen (1992)) ， 都 是 对 变 
量 随 机 加 权 ， 然 而， 两 者 主要 的 不 同 在 于 ， 非 参数 蒙特 卡 罗 逼 近 通 过 对 可 加 的 过 程 
加 权 ， 而 Wild 自助 法 给 残 差 加 权 ， 两 种 不 同 的 加 权 方 法 可 能 导致 不 同 的 结果 ， 相 
关 的 参考 文献 为 Zhu (2003), 文献 中 指出 ， 如 果 模型 非 线性 ， Wild 自助 法 可 能 不 
相合 ， 相 反 ， 在 检验 统计 量 可 以 写成 线性 和 的 情况 下 ， 非 参数 策 特 卡 罗 通 近 总 是 相 
Dih. 

对 于 本 章 中 提出 的 两 种 方法 , RUTABT TABLEAU EOMEDA, 
相对 好 实施 ， 然 而 ， 它 通过 转化 得 到 渐 近 分 布 ， 如 果 样 本 量 比较 小 的 时 候 ， 功 效 可 
能 不 太 好 .在 这 种 情况 下 ， 非 参数 蒙特 卡 罗 检 验 效 果 不 错 ， 从 模拟 的 结果 看 ， 小 样 
本 的 时 候 ， 非 参数 蒙特 卡 罗 检 验 比较 好 . 
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8.4 数值 分 析 


8.4.1 ”蒙特 卡 罗 模 拟 

本 节 中 , 给 出 三 个 模拟 结果 , 分 析 比 较 有 限 样本 的 情况 下 ， 基 于 更 新 过 程 的 检 
验 结果 和 基于 非 参数 蒙特 卡 罗 逼 近 的 结果 之 间 的 差异 ， 三 个 模拟 的 例子 分 别 为 ， 

例 1 (bo, 81) = (t + at?,sin(27t)) ; 

Bl 2 (Go, 61) = (t+ sin(ant),t(t — 1)) 5 

Pil 3 (B80,B1) = (1 + acos(2zt), t(t — 1). 

对 于 这 三 个 例子 ， 协 变 基 都 是 X = (1,XO))7 ， 其 中 XO 是 标准 的 正 态 随机 
变 基 , 假定 { 妇 jsi<naism: 独立 的 [0,1] 上 的 均匀 分 布 ， 随 机 误差 elt) 是 均值 为 零 
的 Gaussian 过 程 ， 且 协 方差 函数 为 





IN Fix = iz, Cov(elti j), Eltiaja)) = AexP(—Alti, j — tie jal); 否则 等 于 0. 


对 例 1 和 例 2, 检验 6o 是 否 为 上 的 线性 函数 ; 例 3 则 检验 Bo 是 不 是 常数 ， 因 此 ， 
在 模拟 分 析 中 , 令 Q1 = {60(-) = Ot} 和 Q2 = {bo(-) = c} 分 别 表示 线性 函数 和 常数 
族 . 例 1 和 2 的 原 假设 为 Ho : Bolt) E 1, 例 3 的 原 假设 是 Ho : Bolt) E N, WX 
是 ， 对 于 这 三 个 例子 ， 原 假设 都 对 应 于 a = 0. 本 节 中 ， 显 著 性 水 平 为 a = 0.05, 
入 = 1. 个 体 的 个 数 和 每 个 个 体 的 重复 观测 分 别 为 n = 25,50 和 mi = 4,20. 为 了 说 
明 检验 统计 其 对 于 局 部 备 择 假设 的 敏感 性 ， 在 这 三 个 模拟 例子 中 ， 计 算 a 分 别 取 
不 同 的 值 的 功效 ， 如 果 用 更 新 过 程 做 假设 检验 ， 通 过 查 Shorack 和 Wellner (1986) 
的 第 748 页 的 Bolt)?d(t) 的 分 布 ， 很 容易 得 出 p 值 . 计算 检验 统计 量 的 功效 和 水 
平 的 重复 试验 为 1000 次 ， 对 于 每 次 试验 ， 用 非 参数 蒙特 卡 罗 法 产生 1000 次 的 参 
照 数据 来 到 近 原 假设 下 ， 试 验 结果 的 临界 值 . 

对 于 上 述 所 提出 的 三 个 模拟 例子 ， 估 计 的 功效 和 用 a 刻画 偏离 原 假设 大 小 的 
散 点 图 分 别 为 图 8.1 ， 图 8.2 和 图 8.3. 从 图 中 不 难看 出 ， 即 使 样本 个 数 n 较 小 这 
两 种 方法 的 功效 都 不 错 . 在 图 8.1 和 图 8.2 中 ，m = 20 时 ,功效 递增 的 很 快 . 这 两 
个 图 同时 给 出 了 本 章 中 所 提出 的 两 种 方法 的 比较 ， 如 果 m = 4 ， 非 参数 蒙特 卡 罗 
鼻 近 的 模拟 结果 比 更 新 方法 的 结果 稍 好 一 些 ， 相反 ， 如 果 m = 20 ， 更 新 的 方法 要 
更 好 一 些 . 也 就 是 ,在 检验 系数 函数 是 否 为 的 线性 函数 例子 中 ， 在 样本 基 比 较 小 
的 时 候 ， 非 参数 蒙特 卡 罗 逼 近 优 于 更 新 方法 ， 反 之 , 用 更 新 方法 的 结果 更 好 一 些 . 
在 例 3 中 ， 非 参数 蒙特 卡 罗 逼 近 显然 比 更 新 方法 要 好 . 
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图 8.1 例 1 的 经 验 功效 
“+” 号， 由 更 新 过 程 的 检验 得 到 的 经 验 功效 ，“x” 号 ， 由 NMCT 法 得 到 的 经 验 功效 ， 


实 线 。 m = 4 的 经 验 功效 ， 虚 线 ， m= 20 的 经 验 功效 


8.4.2 AIDS 数据 分 析 
正如 引言 中 所 提 到 的 ， 本 小 节 的 数据 是 来 自 AIDS 病人 研究 中 心 .数据 包括 
1984~1991 年 283 个 同性 恋 病人 感染 HIV 的 情况 ， 要 求 所 有 的 病人 每 半年 做 一 次 
测试 , 由 于 有 些 病人 没有 按照 要 求 做 检查 ,得 不 到 相应 的 测量 数据 ， 因 此 认为 HIV 
的 感染 随机 发 生 , 且 得 到 的 重复 测量 数据 对 于 每 个 人 来 说 测 其 的 次 数 可 能 就 不 同 . 
关于 试验 的 具体 设计 ， 方 法 可 以 参考 Kasolw et al.(1987). 

统计 分 析 的 目的 是 检测 吸烟 ， 感染 HIV 之 前 CD4 的 百分比 ， 感染 HIV 时 病 
人 的 年 龄 对 感染 之 后 CD4 的 平均 百分比 的 影响 记 ti; 表示 感染 HIV 之 后 第 i 个 
病人 的 第 了 次 测量 的 时 间 (年 ) ，Yi; 表示 在 时 间 ty 时 刻 第 i 个 病人 第 i 次 测量 得 
到 的 CD4 含 其 ， X 表示 第 i 个 个 体 的 吸烟 状态 ， 如 果 第 i 个 个 体 吸烟 ， 则 XD 
等 于 1， 否则 XO 等 于 0. 

为 了 给 系数 函数 一 个 清晰 的 生物 学 解释 , 定义 X( 表示 感染 HIV 时 第 i 个 病 
人 中 心 化 的 年 龄 ， 也 就 是 第 i 个 病人 的 实际 年 龄 碱 去 所 用 病人 年 龄 的 均值 ， 类 似 
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th, XO 表示 感染 之 前 第 i 个 病人 中 心 化 的 cpa 百分比 . 对 于 这 组 数据 ,除了 时 
间 之 外 的 协 变量 都 是 与 时 间 无 关 的 . 


Ex2 INNO vs NMCT n=25, m=4,20 
7 
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图 8.2 例 2 的 经 验 功效 
十 ”号 ， 由 更 新 过 程 的 检验 得 到 的 经 验 功效 ，“x” 号， 由 NMCT 法 得 到 的 经 验 功效 ， 
KR: m = 4 的 经 验 功效 ， 虚线 。 m = 20 的 经 验 功效 


对 于 观测 Yijsti ， Xi = (XXXG) ， 变 系数 模型 可 以 表示 为 
Yig = Boltig) + XP Br (tig) + XP Baltij) + XP Baltij) + eij, 


HH, Go(t) 表示 CD4 百分比 的 基准 ， P(t) ，B2(t) 和 Ga(t) 分 别 表示 吸烟 ，HIV 
感染 时 的 年 龄 ， 感 染 之 前 CD4 的 百分比 对 感染 之 后 CD4 的 百分比 的 影响 . 

对 于 这 组 数据 ， Wu 和 Chiang (2000), Fan 和 Zhang (2000) 用 局 部 光滑 的 方 
法 对 Bi(t)( = 0,1,2,3) 做 非 参数 估计 . Huang, Wu 和 Zhou (2002) 提出 用 全 局 光 
滑 的 方法 估计 AA = 0,1,2,3), 检验 P(t)(1 = 0,3) 的 系数 函数 是 不 是 常数 ， 以 及 
XX 的 系数 函数 是 否 为 零 . Wu 和 Chiang (2000), Fan 和 Zhang (2000) 以 
及 Huang, Wu 和 Zhou (2002) 的 估计 结果 基本 一 致 ， 具 体 的 比较 见 Huang, Wu 和 
Zhou (2002). 
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图 8.3 fi) 3 的 经 验 功效 
“+” 号 ， 由 更 新 过 程 的 检验 得 到 的 经 验 功效 ，“x” 号 ， 由 NMCT 法 得 到 的 经 验 功效 ; 


TR: m = 4 的 经 验 功效 ; 虚线 。 m= 20 的 经 验 功效 


在 本 章 中 , 我 们 对 相同 的 数据 进行 分 析 , 提出 两 种 方法 检验 某 些 协 变 基 的 系数 
函数 是 否 为 某 种 参数 的 形式 ， 本 小 节 对 系数 函数 考虑 6 种 不 同 的 原 假设 ， Bi(t) = 
ai + bit(i = 0,1,2,3) 和 Bi(t) = c(i = 0,1,2,3). 也 就 是 首先 检验 吸烟 ， 年 龄 ， 基 
准 ， 以 及 感染 之 前 CD4 的 百分比 的 系数 函数 是 否 是 时 间 的 线性 函数 ， 其 次 ， 检 验 
它们 是 否 是 常数 ， 假 定 显著 性 水 平 是 0.05 ， 基 于 非 参数 蒙特 卡 罗 台 近 方 法 做 检验 
时 ， 用 1000 重复 得 到 p 值 ， 具 体 的 计算 结果 见 表 8.1. 由 于 Huang, Wu 和 Zhou 
(2002) 也 对 相同 的 数据 做 了 假设 检验 的 研究 , 即 81(t) =0, Blt) =0, Bolt) = co 
和 Balt) = ca ， 为 了 比较 检验 结果 ， 将 他 们 的 结果 列 在 表 8.2. 从 表 中 可 以 看 到 ， 
对 于 检验 系数 函数 AO 是 否 为 常数 的 结果 ， 我 们 所 得 到 的 结果 和 Huang, Wu 和 
Zhou (2002) 的 结果 基本 相同 : 拒绝 fo 为 常数 这 一 原 假设 ， 相反, 没有 足够 的 证 据 
拒绝 其 他 系数 函数 是 常数 这 一 假定 . 对 于 系数 函数 是 时 间 的 线性 函数 这 一 假定 , 本 
章 所 提出 的 两 种 检验 方法 的 结果 都 不 能 拒绝 原 假设 . 而 且 ， 基于 更 新 方法 得 到 的 p 
值 比 基 于 非 参 数 蒙特 卡 罗 逼 近 得 到 的 p 值 要 小 一 些 ,也 就 是 ， 对 于 这 组 数据 ,更 新 
过 程 更 敏感 ， 从 上 面 的 分 析 中 ， 由 于 数据 包含 283 个 个 体 ， 1817 个 数据 ， 样 本 量 
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较 大 ， 结 果 是 合理 的 . 
表 8.1 AIDS 的 数据 分 析 结 果 (a = 0.05) 





更 新 方法 NMCT 更 新 方法 NMCT 
原 假设 原 假 设 
pi P 值 pii p 值 
Bolt) = ao + bot 0.2490~0.2878 0.6930 Bolt) = co 0.0000 0.0000 
Bilt) = a1 + bit 0.7012~0.3910 0.8480 Bilt) = 0.2490~0.2878 0.3540 


B2(t)=cz  0.0879~0.0999 0.1240 
Balt) = ca 0.2878~0.3346 0.4100 


B2(t) = az + bat 0.7012~0.8910 0.8140 
a(t) = a3 + bat 0.4672~0.5652 0.7450 





表 8.2 Huang, Wu 和 Zhou (2002) 的 检验 结果 (a = 0.05) 





原 假设 P ffi 
Bi(t) =0 0.176 
Bat) =0 0.301 
Bo(t) = co 0.000 
Balt) = cs 0.059 


8.5 ”定理 的 证 明 


为 了 证 明定 理 8.3.2 ， 先 给 出 如 下 的 引 理 . 
引 理 8.5.1 对 于 线性 变换 L, 有 


Cov(LBo(r), LBo(s)) = Cov(Bo(r), Bo(s)). 
证 不 妨 假设 > 和 s ， 根 据 荆 的 定义 ， 有 
(BO = B) fo watery arent fo 6,) Bo(dz)]F (at) 
注意 到 LBo 和 Bo 的 均值 为 零 ， 通 过 一 些 初等 运算 ， 可 得 


E(LBo(r) x LBo(s)) 
= B{Bo(r) x Bo(s)} 


—E{Bo(r) x va 


一 co 


o= (glt, 4, AOL [re 2)9(=,0,)Bo(dz)|P(at)} 
~E{Bpo(s) x xf ao} (t)9(t, 0,)” AT} (t) fe (2)g(z, 6,) Bo(dz)| F(dt)} 
+E{ e OIl, 6)" A-1()| i o7*(2)9(2,8-) Bo(dz)|F (at) 


x f° 1(t)g(t, 6)" A(t) 7 a7! (z)g(z, 6) Bo(dz)|F(dt)} (8.5.1) 
一 oo t 
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根据 随机 积分 的 计算 公式 ， 有 


E(LBo(r) x LBo(s)) 
= Cov{Bo(r), Bo(s)} — iE: on '(t)g(t,6,)7 A7! OU 一 1(2)g(z, 0,)F (dz) |F (at) 


= fatten) Ar r 071 (2)g(z, 0-)F(42)]F (at) 
=f fe) AAU Y DA (eo (le) F(a Fat) 
注意 到 上 式 的 第 4 个 元 素 为 
ie Si Walt) ae (eol) > 2) Fae) PCat) 
+f 7 a! (t)g(t, Or)” A“! (t)o} (z)g(z) I(t < z)F(dz)F(dt) 
= 人 [e 1(t)g(t,0,)" A-1 (2)07}(z)g(2)I(t > z)F(dz)F (dt) 
J f moor aooe < z)F(dz)F(dt) 


应 用 Fubini 定理 ， 以 及 综合 以 上 的 分 析 结 果 ， 引 理 证 毕 . 
引 理 8.5.2 ”在原 假设 Ho 下 ， 依 概率 一 致 有 


LRY, = LR, + op(1). (8.5.2) 
证 AUR LEN, 
RRG) = Bs) f OAO 六 o7*(2)g(z,6,) 8, (dz)]F (at), 
(ERR Y(s) = Bs) f Otora OL ie a~ (2)g(z,0,)R%(d2)]F (at). 
根据 下 面 的 两 个 等 式 ， 
S 十 oo 
J Orao ese okaran 


SPSS f” OIO A ee tlt, 0) Zs 


i=l j=1 


— Br (tis, 8r)) F(dt) 
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S 十 oo 
J ates.) aie o*(z)g(z, 0.) RY (dz)|F (dt) 


=X fo (t)9(t, 0) A- (€) 4,00) (tig J? (tig oti Or) (Zigr 


记 1 拓 1 一 


-Br(tij, 0N))F (dt), (8.5.3) 
可 以 得 到 
peg — (LRN)(s) 
= {RY (s ~ F(s)} 


-{N- oe 人 07! (t)g(t, 0)" A7 ()M oo) (tig)? (tig ates, Or) (Die 


i=1 j=l 


—Zijr)F(dt)} 


+{N- L233 a 1 (t)g(t, 0)” A= (t) Iq o0) (tis)? (tig otis Or) 


i=l j=1 
X (Br (tij ON) — Br (tig, Or) F (at) } (8.5.4) 
根据 已 知 结果 ， 存 在 so ， 在 原 假设 Ho 以 及 条 件 4 ， 在 s < so 区 间 ， 一 致 的 有 
RR = Ro, ~ Coltu, 6,)” NY/2(0N — Or) + op(1), 


yD J OOY A reat) Cty, b) 


i=l j=l 


(Bel ti, ON) — Br( tis, 8,))F (dt) 

-f oo 82)" AMO [e -2(2)9(2,87)g(2, 0+)" F(dz)F (dt) NY? (0w 
Oy) + op(1) 

= G5(8,0r)N1/?(Ay — 0) + op(1) 


eyy VM A Olato) 2g) alt, 82) Bag 


i=l j=1 
—Zijr) F (dt) = op(1). 
至 此 ， 引 理 证 毕 . o 
接 下 来 给 出 本 章 中 定理 的 证 明 过 程 . 
证 明定 理 8.3.1 注意 到 


Bul) = Fe YM Bair = Betsy Ou) Mb < 0) 
i=1 j=1 £ 
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= FD Care Alta 82s <0} — Fe D SU 0) 


i=l j=l i=l j=1 


Prt Ilta <D) + Fae YOY A ise -Z(t < 0} 


i=1 j=1 


IRIE N2 SS (lZ - Belt 0I < O) 依 分 布 收敛 于 中 心 化 


i= 1 j: 
的 Brownian 32 3) B, A B 的 协 方差 函数 是 Cov(B(z1), B(z2)) = (x1 A z2). 
NOM? E D {Bolt ON) = Belts 0y SO} 依 分 布 收敛 于 Gr(z, 6r)N ， 以 及 
se 


yaa 5 (2 Zig tas <0) 依 分 布 收敛 于 op(1). 至 此 ， 定 理 证 毕 ， O 
AF 
证 明定 理 8.3.2 根据 引 理 8.5.1 ， 不 难得 到 ， 下 式 依 分 布 成 立 ， 
L(Bo — Go(z,0r)" No) = L(Bo) = Bo. (8.5.5) 


Al LRG 一 Bo. 根据 引 理 8.5.2, Hod LRY > Bo. 定理 8.3.2 证 毕 . a 
证 明定 理 8.3.3 ”首先 ， 类 似 于 引 理 8.5.2 的 证 明 过 程 ， 可 得 


Ly Rk = LyRN + op(1) 
在 s< so 上 一 至 成立, 接 下 来 证 明 
LNR} = LR}, + op(1). 
注意 到 
LRy — LyRy + 0p(1) 
= /rm 0m) Amt [7 op (doles On, Rh (de) Fr (dt) 
- f'omo eeano [oh 2)a(2.82) Rh (a2) Fat 
=f _oROF EAO [ opt 2)o(2.8-) RR (de) Fi (a ~ Fat) 
+f ATOT E Onari [ono om) Rk) 


-om 09" (AA) {ot Egl, ORE (Az) } Ew, (dd) 
sikel (8.5.6) 


> 


an() = oo 人 的 4 人 orile 00) Rb (dz) 
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根据 式 (8.3.3) 和 ow, 的 有 界 性 ， 不 难得 出 序列 ow 是 紧 的 ， 所 以 ， 式 (8.5.5) 的 第 
一 部 分 h 在 s < so 上 一 致 趋 于 零 . 
根据 条 件 (A) 和 ow, 的 有 界 性 ， 定 义 如 下 的 过 程 Bw: 
Bn(s0)= f oOmCO4NG9 f ori ORK (ds) Fm (dt). 
一 co t 
关于 0 一 致 紧 且 连续 ， 由 于 以 概率 bw 一 0; ， 当 NN 和 Ni oot, 3È (8.5.5) 的 
第 二 部 分 by 以 概率 趋 于 零 . 

如 果 把 工 中 的 o 用 ow, 替代 , 类 似 于 定理 8.3.2 的 证 明 过 程 , 得 到 定理 8.3.3 的 
结果 . 

证 明定 理 8.3.4 根据 Wald 定理 ， 对 几乎 所 有 的 序列 {(Xi,Yij,tij) : i = 
1 waitN > co} ， 我 们 只 需要 证 明 @ Rw(., En) 的 协 方差 函数 
收敛 到 Ry 的 协 方差 函数 ，@ 对 于 有 限 指标 { : i= 1 = 1 smi}, 
Rw(,, En) 的 有 限 分 布 dis 收敛， @ 一 致 紧 性 . 性 质 @ 和 @ 不 难 证 明 ， 具 体 细节 不 
再 次 述 ， 关 于 一 致 紧 性 的 证 明 ， 关 侯 于 文献 Zhu, Fujikoshi 和 Naito (2001) 的 证 明 
过 程 ， 这 里 就 不 再 详细 阅 述 ， 定 理 证 毕 . 
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均值 有 限 的 非 负 随机 变量 X 的 平均 剩余 生命 (MRL) 函数 定义 为 : 如 果 e< 
T, 


T 
e(z) = E(X —2|X > 1) = se) f S(u)du, (9.1.1) 


否则 e(z) = 0. 这 里 S(x) = P(X > z) 为 生存 函数 ， 人 = inf{z : S(z) = 0} < o. 
类 似 于 风险 函数 ， MRL 函数 根据 逆转 公式 
S(z) = = exp ( 一 f. e(u)"tau), men (9.1.2) 
a o 
完全 决定 分 布 ， 式 (9.1.2) 由 式 (9.1.1) 不 难得 到 .这 个 函数 在 研究 替换 准则 时 非常 
有 用 ， 因 为 根据 分 量 剩余 生命 的 期 望 可 知 是 否 蔡 代 它 ， 此 函数 在 其 他 研究 领域 ， 如 
精算 、 生 物 医 学 、 人 口 统计 学 、 也 被 广泛 运用 . 
Oakes 和 Dasu (1990) 提出 一 种 新 的 半 参 数 比例 MRL 模型 ,之 后 不 久 , Maguluri 
和 Zhang (1994) 把 这 个 模型 推广 到 回归 问题 的 研究 中 .条 件 MRL 函数 满足 





e(zlz) = exp( 一 0'z)eo(z)， (9.1.3) 


其 中 ，z = (z1,… ,2p) 是 天 维 协 变量 ，8' = (Bi,… , Bp) 是 p 维 回归 参数 向 基 ， 
eo(z) 表示 对 应 于 基线 生存 函数 So 的 MRL 函数 . Maguluri 和 Zhang (1994) 提出 
两 种 方法 估计 8 : 其 中 一 个 估计 是 基于 模型 的 比例 风险 结构 得 到 ， 另 外 一 个 称 为 
简单 估计 ， 基 于 指数 回归 模型 的 极 大 似 然 方程 得 到 . 两 种 估计 方法 只 针对 未 删 失 
数据 . 

本 章 研究 MRL 回归 模型 的 拟 合 优 度 检验 问题 ， 用 两 种 蒙特 卡 罗 方 法 逼近 检 
验 在 原 假设 下 的 分 布 . 本 章 的 部 分 内 容 来 自 文献 Zhu ， Yuen 和 Tang (2002), 理论 
证 明 结果 来 自 文献 (Zhu, Yuen 和 Tang, 2000). 9.2 节 ， 基 于 渐 近 分 布 是 Gaussian 
过 程 的 随机 过 程 , 构造 检验 统计 其 . 由 于 统计 基 在 原 假设 下 的 极限 分 布 的 分 位 点 很 
难 确定 ， 9.3 节 用 两 种 蒙特 卡 罗 方法 ， 即 传统 自助 法 和 NMCT 2k, WERE 
的 统计 基 分 布 估计 值 ， 且 两 种 逼近 方法 都 渐 近 有 效 . 9.4 节 通 过 模拟 研究 本 章 提 
出 的 检验 方法 ， 评 价 两 种 逼近 方法 ， 定 理 的 证 明 过 程 见 9.5 节 . 
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9.2 检验 统计 量 的 渐 近 性 质 


假定 (Xi, 21),… , (Xn, Zn) 是 分 布 函数 为 F(z,z) = P(X <2,Z < 2) H iid. 
的 观测 数据 ，“2 <2” 表示 2 的 各 个 分 量 不 大 于 z 的 相应 分 其 ,通过 一 些 计算 , 
根据 式 (9.1.3) 可 得 


T pz 
= Glz, z)-! j = 4 is 
eolz) = Gla, 2) / J, exp(6’u)(t — 2) F(dt, du) (9.2.1) 
Et, fo Soe So”. Gla,z) = F(T, 2) -F(2,z). WR (9.2.1) 右边 项 为 A(z, z). 


0 


本 章 的 检验 问题 为 ， 在 原 假设 下 
Ho: eolz) = 4(z,z) 对 所 有 z 和 所 有 z < 了 7 成立. (9.2.2) 


特别 地 ， 如 果 原 假设 成 立 ， 函 数 4(z, z) 与 z 独立 . 
参数 6 的 简单 估计 有 定义 为 下 述 方程 的 解 ， 


n 


á XiZi exp('Z;) 
—U(8) =n" X Z - SE — =0. (9.2.3) 
i=1 È Xi exp(ĝ' Zi) : 
Wet = (ty ,tp) ， lell RA t 的 Lo WH. BE: OM e> o0 H lll <e， 
E(exp(t'Z)) < 00 MIL; @ E((Z'Z +1) exp(28'Z)X?) < 00. 如 果 这 两 个 条 件 成 立 ， 
Maguluri 和 Zhang (1994) 得 到 Â 的 强 相合 性 和 渐 近 正 态 性 ,本章 不 再 证 明 的 性 
质 ， 直 接 假定 这 两 个 性 质 成 立 . 
对 任意 z ， 所 有 xz < 全 和 > > zo ， 定 义 


Va(a, z, 20) = n? (Ân (z, z) — Ân (z, 20)), (9.2.4) 


其 中 ， 





n 


exp(P'Zi)(Xi — 2)I(Xi > x, Zi < z) 
Ân(z,z) = = 


(9.2.5) 





$ IT(Xi > a, Zi < 2) 
i=1 
ÆR (9.2.2)A(x, 2) 的 经 验 估计 .在原 假设 下 ， 过 程 Vn 等 于 
Va(z, 2,20) = Mn(z,z) — Mn (z, z0), (9.2.6) 


其 中 ， Mn(z,z) = Va(An(z,z) — A(x, z)). 对 检验 问题 式 (9.2.2) ， 构 造 基 于 Va 的 
Cramér-von Mises 类 型 的 检验 统计 量 


b b eT 
M= f 人 f Vè (T, z, 20)Fxn (de) Fzn (dz)Fzn (dz0), (9.2.7) 
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其 中 ， Fxn 和 Fan 分 别 表示 X M Z 的 边际 分 布 Fx 和 Fz 的 经 验 分 布 ， 上 式 前 
两 个 积分 的 上 限 b = (bi ,bp) 的 各 个 分 量 理论 上 可 选择 为 任意 大 的 常数 向 量 ， 
但 在 实际 运算 中 ， 通 常情 况 下 是 把 样本 2 的 第 7 分 量 的 最 大 值 作 为 bj. 如 果 统 计 
其 的 值 太 大， 拒绝 原 假 设 . 

对 z<T 和 z>zo， 定义 


f(a, 2, 20, X, Z; B, G) 
_ (X — z)exp(8'Z)I(X > 2, 20 < Z < z) - G(B, x, z, zo) 











G(x, z) 
_ U(X > 2,29 < Z <2) - G(&, z, 2))G(8, 1, 20) 
Gle, 2)GCe, 20) 
gı _ XZ'exp(G'Z) \ o- Ġ(B,£,z,z0) Ġ(B, z, 20)G(x, z, zo) 
+ (2 arena)? O ot ea) 


_ (X =a) exp(6'Z)I(X > x, Z < 2) — G(G, x, 20))G(a, z, 20) 
G(x, z)G(x, 20) 

(U(X > z, Z < zo) — G(x, zo))G(zx, z, zo)G(8, x, zo) jaa 

Gla, 2)G(«, 20)? ， (9.2.8) 








其 中 ， 


T z 
G(B, x, z) =/ | exp(P'u)(t — x) F(dt, du), 
G(B, z, z, 20) = G(B, x, z) — G(B, £, z0), 
G(x, 2, 20) = G(x, z) — G(x, zo), 
eg = [FU uo] 


_ E(XZ exp(9'2) 
YO) = Epp) 一 


G(B,2,20) = (Eca PER c02 2)) 


pxp 
E(Z), 
, 


ca, 2,2, 2) è (9.2.9) 


G(B, x, z, 20) = ($0022 20) 35 
p 


假定 6(8) H px p 的 非 奇异 矩阵 ， 接 下 来 的 定理 说 明 V, 和 Wn 的 收敛 性 质 . 
定理 9.2.1 在 原 假设 Ho F, Vn 在 Skorohod 空间 D([0,T) x [0, 00]?) 依 分 
布 收敛 到 中 心 化 的 Gaussian 过 程 V. 对 任意 (z,z,z0) 和 (2°, 2°, 28), V HWA 
BRR 
Cov( f(x, z, 20, X, Z; B, G), f(x°, 2, 28, X, Z; B,G)). (9.2.10) 
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因此 ， 式 (9.2.7)Wn 依 分 布 收敛 到 


b T 
w= f ‘ 人 fÍ V2(z, z, 20) Fx (dz)Fz(dz)Fz(dzo). (9.2.11) 


显然 ， 复 杂 的 协 方差 函数 式 (9.2.10) 使 得 很 难得 到 原 假设 下 极限 分 布 的 临界 
值 ， 本 章 用 两 种 重 抽样 的 方法 有 逼 近 W 的 分 布 ， 估 计 检 验 的 临界 值 . 
接 下 来 考虑 统计 量 W, 对 局 部 备 择 假设 的 功效 ， 局 部 备 择 假设 是 指标 为 n 的 
一 列 函 数 
en(z|z) = e0(zx) exp(—G'z — 5(z)n~4), (9.2.12) 


其 中 ， 5(z) 是 不 依赖 8 的 未 知 函 数 . 平行 于 在 原 假设 下 eo(z) 的 表达 式 (9.2.1) , 
(9.2.12) MRL 的 基线 函数 为 


T z 
eolz) = Gle, 2)! f [ exp(6'u + 6(u)n~4)(t — 2) F(dt, du). 
z 0 
对 eo(z) 做 Taylor 展开 ， 有 
T z 
eo(z) = cea [ [ exp(@’u)(1 + 5(u)n-4 + O(n-?))(t — x) F (dt, du). 
r 0 
因此 ， 在 备 择 假设 式 (9.2.12) 下 ， 式 (9.2.5) 的 An 变 为 


È exp(G'Zi)(Xi — 2X > z, Zi < 2) 
6An(a, 2) = = 





S (Xi > z, Zi <2) 
i=l 


n-# S exp(' Zi) (Xi — 2)6(Zi)U(Xi > z, Zi < 2) 
+ 一 全 > + op(n-3) 
LUX > 2, Z < 2) 
i=] 








= 2 exp (B'Zi)(Xi = a)I(X; > z, Zi < z) $ n-4Q(x,z) 


Ga,2) E op(n-*), 


S (Xi > z, Z < 2) 
i=1 
HL, Qle,2) = (exp(82)(X 一 2)5(Z)I(X > z, Z < 2)). 平行 于 在 原 假设 下 的 过 
FE Vn 在 局 部 备 择 假 设 下 可 得 
EVa (az, z, 20) = Vn(5An(x, z) — "Ân (T, 20)) 
= nh(Ag(e,2) ~ Anla, 20)) + (ZEA - 20) 


+op(1). (9.2.13) 





G(z,z)  G(a, 2) 
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上 式 第 一 项 等 于 式 (9.2.4) 的 你 ,第 二 项 为 非 随机 函数 . 所 以 在 备 择 假设 式 (9.2.12) 
下 ， 过 程 Vn 包含 非 随机 漂移 . 


9.3 Sek S Fi 


在 原 假设 下 根据 Wr 的 极限 分 布 很 难 确 定 临 界 值 时 ， 很 多 文献 采用 蒙特 卡 罗 
的 方法 估计 检验 的 临界 值 ， 本 章 通过 传统 自助 法 和 NMCT 方法 逼近 原 假 设 的 分 
布 ， 从 而 确定 临界 值 . 

1. 传统 自助 法 

W (X5 21) (XG, Za) 表示 由 自助 法 得 到 的 参考 数据 ， 0 根据 参考 数 
据 得 到 的 方程 -U"(B) = 0 的 解 , 其 中 U*(8) 是 对 应 式 (9.2.3) 的 由 观测 数据 得 到 的 
表达 式 ， 第 9.5 小 节 讨 论 了 8* 的 弱 收 敛 性 ， 由 参考 数据 得 到 对 应 于 过 程式 (9.2.6) 
的 表达 式 为 

Va (£, z, zo) = M(x, z) — M*(z, zo), (9.3.1) 


其 中 ， 
M; (a, z) = n? (A; (z, z) — An (z, z)) (9.3.2) 


Ag 是 对 应 于 式 (9.2.5) 的 表达 式 ， 显 然 ， Wi 的 形式 为 
b b T 
Wy = J 人 | (V; (£, z, 20))? Fn (de) Fn (dz)FS, (dz0), (9.3.3) 


HH, Fin 和 Fin 表示 由 参考 数据 分 别 得 到 的 Fx 和 Fz 的 经 验 分 布 . 根据 Burke 
和 Yuen (1995) 的 研究 结果 ， 在 原 假设 下 ， 式 (9.2.7) 的 W 和 式 (9.3.3) 的 Wr 具 
有 相同 的 极限 分 布 . 

定理 9.3.1 在 原 假设 下 ， 对 几乎 所 有 序列 (Xi, Z) (Xn Za) eh, A 
(9.3.3)W 依 分 布 收敛 到 式 (9.2.11) 的 W. 

2. NMCT 法 

首先 由 计算 机 模拟 产生 均值 为 零 ， 方差 为 1 的 iid， 有 界 随机 变量 ei(i = 
1,… ym), HH NMCT 法 得 到 Vi 的 条 件 表达 式 为 








VR (@, 2, 20) = n7t eif(z,z, 20, Xi, Zi; 8, Gn), 
i=l 


其 中 ，f 的 定义 见 式 (9.2.8) ， Gn 表示 G 的 经 验 估计 ， 此 时 ， 相 应 的 W 的 条 件 
统计 其 为 


b b T 
WR f a f (VP (z, z, z0))?Fxn(dz)Fzn(dz)Fzn (dzo). (9.3.4) 
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用 Wie 表示 由 观测 数据 得 到 W 的 值 ,重复 上 述 步 又 天 次 ,分 别 得 到 WR,- , WEK, 
如 果 Wr 值 较 大 ， 拒 绝 原 假设 ， 则 检验 的 p- 值 估计 为 


k 
K+1’ 


其 中 ， 大 表示 WE,- WERK 大 于 或 者 等 于 WP EA, WME 
六 < a ， 拒 绝 原 假设 . 

定理 9.3. 2 ”在原 假设 式 (9.2.2) F, 对 几乎 所 有 序列 {( Xi Z1), (Xn Zn) Fs 
条 件 统计 量 WR 的 渐 近 分 布 等 于 Wn GARDA. 

定理 9.3.1 和 9.3.2 说 明 两 种 逼近 方法 渐 近 有 效 ， 对 固定 的 备 择 假设 ， 不 难得 
出 统计 量 的 功效 渐 近 等 于 1. 对 局 部 备 择 假设 式 (9.2.12) ， 可 得 类 似 定理 9.3.2 关于 
NMCT 条 件 统计 基 式 (9.3.4) 的 结论 ， 见 定理 9.3.3. 

对 NMCT 法 ， 如 果 数 据 来 自 备 择 假设 式 (9.2.12) ， WR 的 分 布依 赖 于 





p= 


5VR(z, z, zo) 








5 nY e; (san Xi Zi b,n) -nè (g - ga) 
i=l 2 s 


根据 IVR (c, 2, 20) 的 表达 式 ， 说 明 在 备 择 假设 式 (9.2.12) F, WE 的 渐 近 分 布 等 于 
在 原 假设 下 它 的 渐 近 分 布 ， 具 体 结论 如 下 ; 
定理 9.3.3 ”在 备 择 假设 式 (9.2.12) 下 ,对 几乎 所 有 序列 {(X1, Z1), (Xn, Zn), 
e}, A (9.3.4) WAP 的 条 件 分 布 收敛 到 式 (9.2.11) W. 


9.4 模拟 分 析 


本 节 通 过 模拟 研究 本 章 提 出 的 检验 方法 ， 以 及 两 种 逼近 方法 的 效果 ， 样 本 大 
小 n = 50,100,200 和 300. 考虑 单一 协 变量 的 情况 ， 2 以 相同 的 概率 取 值 0 或 
1 ， 研 究 问题 属于 两 样本 的 情况 ， 对 模型 式 (9.1.3) ， 不 难看 出 ， 其 中 一 个 样本 的 
MRL 函数 和 另外 一 个 样本 的 MRL 函数 成 比例 ， 且 比例 系数 为 exp(-B). 因此 ,由 
式 (9.1.3) ， (9.1.1) 和 (9.1.2) 可 得 


exp (Bz)—1 
Sia) = Sola) ( [ nz’ So(u)du) (9.4.1) 


其 中 ， jo = E(X) = eo(0). ME Z 和 So ， 根 据 式 (9.4.1) 可 以 产生 X. 给 定 显著 
ACEH a = 0.1,0.05 和 0. te 对 每 组 模拟 数据 ， 通 过 传统 自助 法 产生 1000 AS 
考 数据 分 别 估计 分 布 的 不 同 临界 值 . 类 似 地 ， 如 果 采 用 NMCT 法 ,产生 1000 组 以 
相同 概率 取 值 +1 的 {ei :i=1,… ,n}. 
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本 节 假 定 So(z) = (1 一 0.5z); ， 也 就 是 具有 线性 MRL 函数 的 生存 分 布 族 ， 见 
文献 Hall 和 Wellner (1984). 8 值 等 于 0.8 ， 主 要 的 模拟 结果 见 表 9.1. 每 一 列表 示 
对 1000 组 模拟 数据 原 假设 被 拒绝 的 概率 ， 在 小 样本 的 情况 下 ， 自 助 法 检验 比较 保 
F. 随 着 的 逐渐 增 大 ， 模 拟 结果 越 来 越 靠近 给 定 水 平 . 由 NMCT 法 得 到 的 结 
基本 上 都 接近 给 定 水 平 . 


表 9.1 ”由 蒙特 卡 罗 方法 在 原 假设 下 得 到 的 经 验 功效 








自助 法 NMCT 
n a=01 a = 0.05 a = 0.025 a=01 a = 0.05 a = 0.025 
50 0.077 0.031 0.010 0.104 0.061 -+ 0031 
100 0.073 0.036 0.020 0.071 0.039 0.021 
200 0.091 0.037 0.018 0.096 0.049 0.022 
300 0.100 0.047 0.024 0.106 0.052 0.033 


为 了 研究 检验 对 备 择 假设 的 敏感 性 ， 从 基线 分 布 是 Weibull 分 布 的 比例 风险 模 
型 产生 X ， 此 时 基线 A(z|z) = Ao(x) exp(0.8z). 基线 风险 函数 的 形式 为 Xo(z) = 
abx! ， 参 数 a 和。 分别 取 值 为 3 和 0.00208 ， 则 风险 函数 递增 ， 在 两 样本 问题 
中 ， 表 9.2 给 出 检验 在 备 择 假设 下 的 经 验 功效 ， 从 表 9.2 看 ， 由 NMCT 法 得 到 的 
模拟 结果 比 由 自助 法 得 到 的 模拟 结果 好 ,在 小 样本 的 情况 尤其 明显 . 在 样本 较 大 的 
情况 ， 由 两 种 方法 得 到 的 经 验 功效 接近 1. 


表 9.2 ”在 备 择 假设 下 检验 的 经 验 功效 








自助 法 NMCT 
n a=0.1 a = 0.05 a = 0.025 a=0.1 a = 0.05 a = 0.025 
50 0.401 0.246 0.109 0.588 0.548 0.496 
100 0.684 0.548 0.406 0.914 0.874 0.821 
200 0.923 0.876 0.802 0.988 0.974 0.964 
300 0.991 0.985 0.960 0.999 0.997 0.995 





总 的 来 说 ， 在 样本 量 不 太 少 的 情况 ,两 种 逼近 方法 的 模拟 结果 都 不 错 .在 小 样 
本 的 情况 ， NMCT 双 近 相对 较 好 .为 了 提高 在 小 样本 时 自助 法 的 模拟 结果 ， 可 考 
虚 需 大 基 计 算 的 自助 方法， 或 者 采用 NMCT Min. 


9.5 定理 证 明 


9.2 节 定义 了 4 种 类 型 的 G 函数 ， 也 就 是 Gl, z), G(B,z,z), G(z,z,20) 和 
G(G, 2, 2,20). Gn(z,z) , Gn(8,2,z), Gn(,z,20) = Gn(z,z) — Gna, zo) 和 
Gn(B,@, z, z0) = Gn (8, £, z) — Gn(8, x, 20) 分 别 表示 对 应 它们 的 经 验 形式 . 
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证 明定 理 9.2.1 根据 定义 ， 式 (9.2.4) 的 A, 函数 可 表示 为 





对 z<T 和 z> 2, 


Anlz, z) — An(z, z0) 
_ Gn(B,z,2) _ Gn(B,z,z0) 
Gr,(2,z) Cn(z,zo) 
_ Gn(B,2, 2,20) - G(B,2,2,20) _ (Gn(a,2, 20) — G(x, z, z0))Gn (Â, 2, 20) 











Cn(z,z) Cn(z,z)Gn(z,20) 
+ (SB,z,z,20) _ Gle, z, 20)Gn (Ê, 2, 20) 
Cn(z,z) Cn(z,z)Gn(z,zo) 


=! Im — Im + Ing: 


根据 经 验 过 程 的 理论 , 不 难得 到 Vi(Gn(z, 2)G(x,z)) 和 Vn(Gn(B, x, z)—G(B, x, z)) 
为 渐 近 Gaussian 过 程 ， 注 意 到 C(G,x, 2) 连续 且 关 于 6 的 一 阶 导数 有 界 ， 又 因为 
及 的 强 相合 性 和 渐 近 正 态 性 ， 根 据 Taylor 展开 式 可 得 





$ (Gn (B, T, z, 20) — G(3, T, z, 
nira ECAs es (Bye 220) | (1), (9.5.1) 
wah Ing = 1 (Gale 220) ~ Gl, 2, 20))G(9, 2,20) Pare, is 





G(x, z)G(z, 20) 


在 原 假设 下 ， G(x, 2, 20) = G(x, z, 20)G(G,x, 20)/G(x, zo). 因此 


le = BES (ce zz0) ~ G(8,2, 2,20) 





GulB,2,20) _ G(B,2. 20) 
-esal( Ge,a) Ca) )) 


二 (cnmn (9.5.3) 
而 且 
Plea = B= AGO. 2.5.2) 5 at) (0.5.4) 





Grle,z) G(z, 2) 
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niG(z,z, zo)Insa _ n (Gn(B,2, 20) — G(B, ,20))G(z, 2, 20) 
Gn(z, 2) = Gn(z, z)Gn(z, 20) 
m n? (G(B, x, z0) — G(8, £, z0))G(z, z, 20) 
G(x, z)Gn(2, z0) 
_ nÈ Gn(a, zo) — Gla, 20))G(@, z, 20)G(B,2, zo) 
Gn(x, 2)G(«, z0)Gn (T, 20) 
_ nÈ (Gn(B, T, 20) — G(B, x, 20))G(a, z, 20) 
7 Glz, 2)G(z, zo) 
_ n¥(Gn(z, zo) — G(x, z0))G(z, z, 20)G(B, £, 20) 
G(a, z)G(z, zo)? 
n3 (Ê — B)'G(B, x, 2)G(2, z, zo) 
ee Gla, 2)G(a, 2) + 0p(1), (9.5.5) 




















HF, G(B, x, 20) 和 G(B, x, z, 20) 的 定义 见 式 (9.2.9). 注意 到 (8-6) = -eB-1(B)D(B)+ 
op(1/ vn), XAAR (9.5.1)~(9.5.5) ， 可 得 


Valz; 2, 20) = nè (Im — Im + In) 
= ni { C822, 20) — GB, «, z, 20) 
a G(a, z) 
(Gn(a, z, 20) — G(x, z, 20))G(B, x, zo) 
G(a, z)G(x, zo) 
O(BYO-"(B) fa 
= Gey (CO 2,20) 
_ (Gn(G, 2, 20) — G(B, ©, 20))G(@, 2, 20) 
G(x, z)G(x, z0) 
(Gn(@, 20) — G(x, z0))G(z, z, 20)G(G, x, zo) 
Ge. 2)G(e, 20)? ) + 0p(1) 





2 Shes, CA] 
G(x, zo) 








+ 


=n} 5 f(z, z, zo, Xj, Zj; B. G) + op(1), (9.5.6) 
j=1 


其 中 ， (3), 6(8) 和 了 的 定义 分 别 见 式 (9.2.3) ， (9.2.9) 和 (9.2.8). 

用 下 表示 由 {f(T, z, zo, X, Z;8,G) : (x, 2, 2) € [0, T) x [0, 00)?, zo < 2} 组 成 的 
函数 族 , 由 于 函数 G(x, z) 和 G8, x, 2) 绝对 连续 , 且 示 性 函数 族 {I(X >z, Z < 2): 
(wz) € [0, T) x [0,00)} 属于 VC 族 ， 丰 也 属于 VC 族 (Pollard, 1984). 根据 Pollard 
(1984, p150~157) 引 理 VII 15 和 定理 VII 21 ， Van 依 分 布 收敛 到 均值 为 零 ,， 协 方差 
函数 为 式 (9.2.10) 的 Gaussian 过 程 . 定理 证 毕 . 
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证 明定 理 9.3.1 根据 Taylor 展开 式 ， 可 得 


0 = niD(B)=ni0(8) + 6(8)n3 (Â — 8) + op(1), (9.5.7) 
0 = ntU*(3*) =n3U*(B) + 0* (Ân? (8* — Â) + op(1), (9.5.8) 


itp, 6 fl 6* 分 别 是 由 观测 数据 和 自助 法 产生 的 参考 数据 得 到 的 式 (9.2.9) 中 O 
的 经 验 形式 .根据 Burke 和 Yuen(1995) , 可 得 86(6) 和 O*(3) 都 收敛 到 6(6). 因此 ， 
根据 Yuen 和 Burke (1997) 的 推导 方法 ，mns(U*(D) 一 误 (8)) 和 nè (O(8) — E(0(8))) 
有 相同 的 渐 近 正 态 分 布 , 证 明 的 思想 是 : 把 n3(0(3)- E(0(8))) 表示 成 关于 经 验 过 
程 和 6 的 随机 积分 形式 . 关于 nd (U*(B)—O()) , 类 似 地 可 以 表示 为 由 自助 法 产生 
的 参考 数据 得 到 的 经 验 过程 和 有 的 积分 表达 式 . 根据 经 验 过 程 的 理论 和 自助 法 的 
一 些 性 质 得 出 结论 . 根据 定义 0(8) = E(U(8)) = 0 ， 注 意 到 式 (9.5.7) 和 (9.5.8) , 
nè (0° — Â) 和 nè (Ô — 6) 具有 相同 的 渐 近 分 布 . 

用 Gr 表示 根据 参考 数据 得 到 G 的 经 验 形式 ， 根 据 自助 法 理论 ，G* 是 G 的 
相合 估计 ， 与 定理 9.2.1 的 证 明 过 程 的 第 一 步 推 导 一 致 ， 可 得 











Aj (a, z) — An (z, zo) 
_ Gi(6",2,2) _ G3(8",2,20) 
G3(x, z) G(T, 20) 
Garl", x, z, 20) — Gn (b°, £, z, 20) 
Gi (z, 2) 
_ (Gh (2, 2, 20) — Gn (T, z, 20)) Gi (8*, £, 20) 
Gh (a, z)G}, (x, zo) 


(ege _ Gl, 2, 20)G; (0", 1, a) 
) 











Gs(z, 2) G3 (a, 2)G (T, 20 
=I, — I +,. (9.5.9) 


Gi(B,z,z,20) 和 Gn(B, x, z, 20) 关于 有 的 一 阶 导数 分 别 记 为 G%(B,z,z,z0) 和 Gn(B, 
Zz,z,20)， 不 难看 出 G3(8,2, 2,20) 和 Gn(B,2, 2,20) 都 收敛 到 C(B,x,z, 20). 根据 
Taylor 展开 式 和 6 的 渐 近 正 态 性 ， 有 


nå (G3 (B, x, z, 20) — Gn (B. 2, z, 20)) 


GE + op(1). 





nih, = 


类 似 地 ， 根 据 8* AG, 的 相合 性 ， 可 得 


bre Aaaa- Gn(@, z, 20))G(B, £, zo) | 
m= G(x, z)G(z, zo) or(1). 
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由 Giné 和 Zinn (1990) 的 定理 2.4 ,根据 式 (9.5.1) 和 式 (9.5.2), ?7 主 玉 (nr 二 态 :) 和 
nèIn, (3 Ing) 的 极限 分 布 相同 ， 式 (9.5.9) 的 最 后 一 项 ir, 可 表示 为 


in = ots (Gra sa) -Gnlz 2o 


G(x, 2) 
G3(8",2,20) _ Gn(B, 2, 20) 
-ee 人 [CC )) 


1 Gn (Ê, z, a) 


tama (cutie 2,20) — Gn(z, z, a) Gea) 
1 
= GeGay Uns, + Gn(2 z, z0) Iran) + Rn 
=: Ih, + Rh. 


类 似 于 式 (9.5.4) 和 (9.5.5) 的 推导 ， 有 


7 人， n#(B* — A)'G(B,z,z, z) | ol1) 














Gaia) Glz,2) 
和 
n4Gn(2, 2,20) Mig _ nd(G;(B,z,20) — Gn(B,2, 20))G(2, z, 20) 
Gi (a, 2) = G(x, z)G(x, zo) 
_ 2 (G5 (E, 20) ~ Gn (z, 20))G(z, z, 20)G(8, £, 20) 
G(x, z)G(z, z0)? 
n} (B* — BGG, x, z0)G(z, z, zo) 
s Gle, 2)G(a, 20) tal). 
根据 n#(6" — Ô) 的 渐 近 正 态 性 ， 以 及 Giné 和 Zinn (1990) 的 定理 2.4 ， 可 得 nd Tt, 
和 n3 In, 的 极限 性 质 相同 ， 而 且 
nir = ni Gales) 3 (An (@, 2) — An (x, 20)) = nè (A, (2, 2) — An(2, 20)) + op(1)- 


由 式 (9.3.1), (9.3.2), (9.5.6) 和 (9.5.9), 
Vi (z, z, 20) = M3 (2,2) — M3(z, zo) 
= nè (AR (2,2) — AX (a, zo) — (An(2,2)) — An(2, 20))) 
= ni (It, — It, + Te) + op(1). 
因此 , 在 原 假设 Ho F, Vz, z, 20) 和 Vale, z, zo) 有 相同 的 极限 . 这 说 明 式 oe 
Wi RAPA (9.2.11) W. 
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证 明定 理 9.3.2 和 9.3.3 这 里 ， 只 给 出 定理 9.3.2 的 证 明 ， 在 备 择 假设 式 
(9.2.12) 下 ， 可 类 似 得 到 定理 9.3.3 的 证 明 . 

关于 定理 9.3.2, 只 需 证 明 @ VE 的 协 方差 函数 收敛 到 VV 的 协 方差 函数 ，@ VF 
的 有 限 维 分 布 fdis 收敛 到 V 的 有 限 维 分 布 ;@ VE 的 一 致 紧 性 .对 半 参 数 随机 删 
失 模 型 的 检验 ， Zhu, Yuen 和 Tang (2002) 证 明了 用 NMCT 方法 逼近 分 布 时 的 渐 
近 有 效 性 . 

给 定 样本 ， VR(z,z,zo) 和 VR(z0,z0, 28) 的 协 方差 是 


n~! Sle, 2,20, X, Zj; Â, Ga) f (2°, 22,28, Xj, Zii Â, Gn). 


j=l 


上 式 收敛 到 式 (9.2.10) HDT FPR, AIE, HERO ALL. HEA ORRE 
得 性 质 @， 为 了 记号 上 的 简单 ， 记 


F = {jf(z,zzoX, Z; Ê, Gn) : (£, z, zo) € [0, T) x [0, 00)?} 


Si =: (2i zi 201, X, Z Â, Gn), Palfi) 表示 n- PUC Zis Zois Xj, Zj Â, Gn). 定 


X [5] = {(ft, fa): fis fa € F, (Pali — f2)?)? < 6}. 要 证 一 致 紧 性 @， 需 证 对 任意 
7Y 和 e>0, 存 在 5>0 满 足 


limsup Plsupnž |V (e, 21,201) — VP (z2, 22, 202)| > € |(X,Z)) <y. (9.5.10) 
根据 Hoeffding 不 等 式 ， 
PIG 21,201) — V (z2, 22, 202)| > € | (X, Z)) 
要 证 式 (9.5.10) ， 需 要 证 明 ， 存在 足够 小 的 5 ， 使 得 积分 


6 2 
HEF, P)= f (ED Pa) )idu 
0 


有 限 .其 中 Nou, F, Pa) 是 满足 下 述 条 件 的 最 小 整数 m :存在 m 个 函数 fi, fma 
对 任意 SEF, 


< 2exp ( 


2) 3 
min (Pa(fi — f)?)? <u, 


由 于 f 是 示 性 函数 的 线性 组 合 ， 所 以 天 属于 VC 族 . 因此 ， 存 在 独立 n 的 c>0 
Alw>0, 
No(u,F, Pa) < cu”, 
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则 存在 c>0 
(ô, F, Pn) < 663. 


这 说 明 Pollard (1984, 150~151 页 ) 本 度 引 理 的 条 件 (16) KIL. 根据 Pollard (1984, 
144 页 ) 链 引 理 ， 存 在 [6] 的 可 数 稠密 子 集 [人 ]" 满足 


P(supm IVP (æn, 21,201) — VË (aa, 22, 202) > 26J2(5, F, Pa)I(X, 2)) < 26. 


由 于 函数 f 的 左 连续 性 ， [5]* 可 被 团 替代 . 选择 比 Y/2 和 (€/(26c))? 小 的 5 ， 得 
到 WE 的 一 致 紧 性 ， 定 理 证 毕 . 


BIOS HAER 


10.1 3] # 


假定 数据 服从 多 元 正 态 分 布 ， 可 以 用 极 大 似 然 比 检验 (LRT) 研究 样本 的 同 
方差 性 检验 问题 . LRT 的 小 样本 分 布 很 复杂 ， 但 LRT 在 原 假设 下 的 渐 近 分 布 是 卡 
方 分 布 . Box(1949) 修正 了 Bartlett 的 LRT ， 提 出 M 统计 其 检验 样本 的 同方 
差 性 ， 统 计 鞭 的 极限 分 布 也 是 卡 方 分 布 . 

在 没有 正 态 假定 的 情况 ，LRT 的 形式 和 正 态 假定 下 LRT 的 形式 不 一 样 . 如 果 
仍然 用 正 态 假定 下 得 到 的 统计 其 ， Bartlett 的 同方 差 检 验 的 统计 基 的 渐 近 分 布 不 
再 是 卡 方 分 布 ， 而 是 卡 方 分 布 的 线性 组 合 ， 可 参考 文献 Zhang 和 Boos (1992). 在 
原 假设 下 ， 很 难得 到 统计 其 的 小 样本 分 布 ， 迫 使 研究 工作 者 寻求 其 他 解决 问题 的 
THE. 蒙特 卡 罗 方 法 ， 如 自助 法 ， 是 其 中 解决 问题 的 方法 之 一 .在 一 个 样本 的 问题 
中 ，Beran 和 Srivastava (1985) 考虑 基于 协 方差 矩阵 的 特征 值 函数 的 自助 法 检验 ， 
Zhang, Pantula 和 Boos (1991) 提出 了 合并 自助 法 ， 对 大 样本 的 同方 差 检 验 ， 在 没 
有 正 态 假定 的 前 握 下 ， Zhang 和 Boos (1992, 1993) 用 自助 法 得 到 Bartlett 统计 最 
的 渐 近 临界 值 ， 同 时 ， Zhang 和 Boos (1993) 发 展 了 平方 类 型 统计 其 的 自助 法 理 
论 ， 通 过 例子 说 明 Bartlett 检验 的 思想 . 

本 章 提出 了 另外 一 种 基于 Roy (1953) 的 并 集 -交集 原理 构造 的 多 元 检验 统计 
其 .本章 的 大 部 分 内 容 来 自 文献 Zhu, Ng 和 Jing (2002). 因为 随机 向 基 为 多 元 正 
态 分 布 当 且 仅 当 随机 向 其 的 任何 非 零 线性 函数 是 一 维 正 态 分 布 ， 关 于 多 元 正 态 分 
布 的 检验 问题 可 以 看 作 是 所 有 线性 组 合 的 一 元 正 态 分 布 的 检验 问题 ， 由 所 有 的 线 
性 组 合 得 到 的 拒绝 域 的 并 集 为 原 假设 是 多 元 正 态 分 布 的 拒绝 域 . 两 样本 Roy 检验 
根据 Wishart 矩阵 的 最 大 和 最 小 特征 值 构造 ， 到 目前 为 止 ，Roy 检验 没有 推广 到 
k(k > 2) 样本 的 检验 问题 ， 其 中 一 个 原因 可 能 是 在 两 样本 情况 下 用 方差 比 的 大 小 
比较 方差 很 难 推广 到 k(k > 2) 样本 的 情况 . 接 下 来 对 这 一 问题 做 简单 描述 ， 在 两 
样本 的 情况 ， 由 于 of 和 of 互 为 倒数 ， 根 据 of/o3 R 03/0? 的 大 小 比较 ， 两 个 方 
差 的 大 小 比较 合理 .在 k(k > 2) 样本 情况 下 就 没有 这 么 简单 ， 如 果 用 方差 比 的 组 
合 构造 统计 量 ， 若 方差 比 关 于 i 和 7 并 不 是 置换 不 变 的 ， 一 个 方法 就 是 对 满足 所 
A R/G <i 关 7 <S k) RAEI, CSR 7 > i 的 方差 比 求 和 得 到 
的 统计 基 的 结果 可 能 并 不 一 致 . 如 果 把 所 有 i A ji 的 方差 比 求 和 作为 统计 量 ， 虽 
然 检 验 关于 i 和 7 不 变 ， 统 计量 本 身 让 人 很 费解 ， 我 们 通过 两 样本 的 情况 说 明 此 
问题 ， 如 果 统 计量 等 于 of/o3 + 03/0} ,车 o/o3 较 大 ， 则 03/0? guh, RAZ 
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后 的 值 大 小 适中 ， 反 之 亦 然 . 在 k(k > 2) 样本 情况 ， 也 可 以 得 出 类 似 的 结论 ， 然 
Wi, lo? —of|//(op +--+ oR <i FAS < 此) 关于 i 和 j 置换 不 变 对 满足 i < 了 
的 lo? - oF |/(of +--+ 0%) 求 和 构造 统计 量 更 合理 一 些 ， 同 样 ， 对 满足 i<j 的 
lo? —o3|/(o2 +- +02) 求 最 大 值 也 比较 合理 . 在 本 章 ， 考 虑 用 绝对 值 的 最 大 值 和 
绝对 值 的 求 和 (或 平均 ) 构造 统计 晤 ， 通 过 模拟 ， 根 据 求 和 得 到 的 统计 其 的 模拟 结 
果 较 好 

没有 对 数据 做 正 态 假定 ， 且 没有 文献 关于 kk > 2) 样本 的 LRT 和 并 集 - 交 
集 原理 的 研究 ， 本 章 基于 样本 协 方差 矩阵 特征 值 的 不 同 ， 研 究 了 klk > 2) 样本 的 
同方 差 检验 问题 ， 为 了 得 到 检验 的 临界 值 和 p 值 ， 考 虑 重 抽样 方法 ， 如 自助 法 
NMCT 法 和 置换 法 ， 是 否 有 效 ， 所 有 的 这 些 重 抽样 方法 对 本 章 所 提出 的 统计 量 渐 
近 有 效 ,在 某 些 情况 下 ， 从 理论 上 可 以 得 到 置换 法 和 NMCT 法 比 自助 法 在 原 假设 
下 得 到 的 功效 好 . 在 本 章 的 模拟 部 分 ,置换 检验 的 功效 在 大 部 分 情况 下 比 自助 法 得 
到 的 功效 好 ， 且 自助 法 和 NMCT 法 得 到 的 功效 差不多 . 但 是 NMCT 法 更 容易 实 
施 ， 从 模拟 结果 看 ， 本 章 提出 的 方法 比 Zhang 和 Boos (1992) 的 自助 Bartlett 检验 
模拟 结果 好 


10.2 检验 统计 量 的 构造 


WAXY XY, XD i = 1,… ,k 表示 均值 为 kt ， 协 方差 矩阵 为 DO 的 
iid. fs d AMAIERA, 且 4 TEAR. ARRE, R 
设 和 备 择 假设 分 别 是 


Hy: 5M = 50) =…= DY, Wy: SO 4 SO 对 菜 些 i 关 j 成 立 . (10.21) 
第 ;个 样本 的 样本 协 方差 矩阵 记 为 
50 = L Ley = p(X — Oy? , (10.2.2) 
= 


其 中 ， AO 表示 A 或 样本 均值 ， 分 别 对 应 WO 已 知 或 未 知 的 情况 ， 所 有 样本 的 
协 方差 矩阵 为 


k 3 
1 PPP 
=N. > mN = > mi). (10.2.3) 
i=l i=l 


基于 多 重 比较 的 思想 (Dunnett, 1994; O’Brien, 1979, 1981), 用 两 两 比较 的 组 合 构造 
检验 ， 第 【个 和 第 ; 个 样本 的 比较 通过 下 面 两 个 式 子 


Mi= max { [TE (so - 50) 2 epenn), 
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Ay = averaged [7 5-12(50 — SO) S-egi. (10:24) 


统计 其 通过 k(k — 1)/2 对 比较 值 的 平均 构造 ， 即 





2 
LM= RE} Mu (10.2.5) 


2 
LA= R yA : (10.2.6) 


如 果 LM (LA) 比 临界 值 大 ， 拒 绝 原 假设 ， 首 先 研究 LM 和 LA 的 极限 分 布 . 

在 给 出 结论 之 前 ， 说 明 对 称 矩 阵 向 量化 的 记号 ， vech(5) 表示 d x d 维 对 称 矩 
RE S 的 d(d + 1)/2 个 不 同 元 素 组 成 的 列 向 量 ， 首 先是 3 的 第 一 列 ， 接 着 是 把 第 一 
个 元 素 去 掉 之 后 的 第 二 列 ， 依 此 类 推 . 

引 理 10.2.1 š mi > ooff = 1,…,k) H, 假定 mi/N 一 Xi 0 < NM < 
1 ; 样本 的 分 布 连续 且 具 有 有 限 的 AMIE. 在 原 假设 下 ， mm /NE-(80 一 
SO)SI2IL < il < k) 的 联合 分 布 等 同 于 VW 一 VANWi, 1 <il <k 的 渐 近 联 
合 分 布 ， 这 里 Wi,- We 独立 ， 且 vech(Wi) 是 中 心 化 的 多 元 正 态 分 布 ， 协 方差 矩 
阵 为 

V; = cov(vech((X 人 -AD)(CX -AD)T)) . (10.2.7) 


因此 ， LM 和 LA 的 渐 近 分 布 竺 于 以 下 两 个 随机 变量 的 分 布 
Reap Let VAW - VAWE meee}, (10.2.8) 
i<l 
ra yÈ weel VAW — VNWi 的 特征 值 的 绝对 值 }. 
i<l 
(10.2.9) 


在 备 择 假设 下 ， LM fa LA 收敛 到 无 穷 . 
根据 引 理 的 结论 ， 很 难 通过 渐 近 分 布 得 到 检验 的 p 值 估计 ， 但 是 可 以 用 重 抽 
样 的 方法 信 计 pb 值 
10.3 RERI 


本 节 考 虑 三 种 类 型 的 抽样 方法 ， 即 自助 法 、 NMCT 法 和 置换 检验 . 
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10.3.1 ”传统 自助 法 
由 Zhang 和 Boos (1992) 的 合并 重 抽样 步 又 的 启发 ， 记 


(Zaye = (XP - A9, XR A, AP AO, AR- A), 
(10.3.1) 
其 中 , AO 等 于 AN 或 样本 均值 ,分 别 对 应 于 WO 已 知 和 未 知 两 种 情况 .用 (Zi, Zi) 
表示 从 样本 (21,… Zn) 中 有 放 回 抽样 产生 的 参考 数据 ， 记 


(Zj - Z*) (Zp - Ze)? (i=1,.,k), (10.3.2) 


ME = max { PUPS (57 — 5) -" ane meet 
AB = average 1 [UM 5-1/2 (5 — Sp -VEe ei |. 
N 


由 参考 数据 得 到 对 应 式 (10.2.5) 和 (10.2.6) 的 表达 式 分 别 为 





2 
LMB = MP, 10.3.3 
B = kay > ii ( ) 

= 2 B 
LAs = FET Yak. (10.3.4) 


以 下 定理 说 明 LLMs 和 LM, UR LAs 和 LA 渐 近 等 价 . 

定理 10.3.1 假定 引 理 10.2.1 条 件 成 立 ,对 几乎 所 有 独立 的 ,具有 有 限 4 阶 距 的 
dxi 随机 向 量 序列 (大 人 XM XP), XO) x, X), 
E E(X(?) = p®, cov(X) = E (i = 1, ,月 ,给 定 样本 (XI, XD XO, 
1 XQ) XP, XW), RARE LMp (LAs) 的 收敛 到 LM (LA) 的 渐 
近 分 布 . 

根据 定理 10.3.1 的 结论 ， 可 以 通过 从 观测 数据 中 抽样 产生 参考 数据 得 到 的 条 
件 统计 量 估计 检验 LM (LA) 的 临界 值 . 


10.3.2 NMCT 逼近 


如 果 天 样本 的 各 个 样本 量 相同 ,如 m, 可 采用 另外 一 种 更 容易 实施 的 条 件 检验 
方法 .在 某 些 特殊 的 情况 下 NMCT 检验 精确 有 效 ， 在 一 般 情况 下 ， 定 理 10.3.3 说 
B NMCT 逼近 的 渐 近 有 效 性 . 
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用 两 样本 的 情况 说 明 NMCT 检验 精确 有 效 ， 假 定 在 原 假设 下 所 有 变量 XP, 
XP, XO AXP XO... XO 是 均值 已 知 的 ，ii.d. 的 d- 维 分 布 . 不 妨 假定 
均值 等 于 零 . 记 坟 = (XP XPT- (XP (XP), REEE, YG = 1,… ,n) 
的 分 布 对 称 ， 对 于 独立 Y 的 ， 以 相同 概率 取 值 +1 的 随机 变量 ej, Yj A ej 六 
同 分 布 ， 且 e; 和 ejY; 独立 (根据 ey 和 Yj 的 独立 ， 以 及 Y; 的 对 称 性 ) 因此 ， 对 
任意 统计 其 (Yi,… Ym), CRAMA T(er¥i,--- mY) 的 分 布 相同 ， 其 中 e; 
是 Lid, 的 随机 变量 ， 用 计算 机 模拟 产生 > 组 变量 {ei : i = 1,.… ,mj}, 相应 的 可 得 
7 个 (ei ,… ,emYn) ， 不 妨 记 为 T-T". 记 T? =: T(Yi，… ,Yin). 不 难得 到 
Tili = 0,1.…,7) 是 7 +1 个 iid. 的 随机 变量 ， 假 定 原 假设 在 T 值 较 大 时 被 拒 
绝 ，p- 值 的 估计 等 于 TO, T? ,7" 值 大 于 或 等 于 TO 值 的 比例 . 如 果 估计 的 了 值 
比 给 定 水 平 a 小 ， 拒 绝 原 假设 ， 这 说 明 NMCT 逼近 精确 有 效 ， 

事实 上 ， 假 定 样本 为 ;id, 分 布 且 均值 已 知 这 个 条 件 限制 太 强 ， 接 下 来 考虑 一 
般 的 情况 ， 用 估计 代替 未 知 的 均值 ， 说 明 如 何 构造 NMCT 统计 量 ， 以 及 逼近 的 相 
合 性 . 

首先 标准 化 数据 得 到 


2 = E72 (XP AO) (Ga, mj i= 1 k). (10.3.5) 


el ,em 表示 以 相同 概率 取 值 £1 的 Lind. 随机 变量 ,对 1 <i < l< k, B-V2(HO- 
SW) S-1/2 的 NMCT 表达 式 为 





1< i 
Wa = LY o [ZPZP — ZPP]. (1036) 
j=1 


相应 地 ，LM 和 LA 的 NMCT 表达 式 为 
2 2 
LM = Fp) mae { y Ty Wattret}, (10.3.7) 


2 m? 
Lan = gp Dese { yewua) . 
(10.3.8) 


以 下 定理 说 明 LMpr (LAR) 和 LM (LA) 渐 近 等 价 . 

定理 10.3.2 在 引 理 10.2.1 的 假定 条 件 下 , 给 定 样本 ,条 件 统计 量 LMp (LAR) 
的 收敛 到 LM (LA) 的 渐 近 分 布 . 

检验 的 p 值 估计 类 似 于 10.3.2 小 节 在 NMCT 精确 有 效 时 的 估计 方法 ， 用 
LMẸ, -LME 表示 由 组 独立 随机 变量 组 {e1,… ,enm} 得 到 ME, 用 LM 
表示 由 观测 数据 得 到 统计 其 LM 的 值 ， bp 值 的 估计 等 于 LMA4),… , LMP 值 大 
于 或 等 于 LMP 值 的 比例 ， 类 似 的 可 估计 检验 LAR 的 p 值 . 
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10.3.3 ”置换 检验 

NMCT 法 的 缺点 是 它 只 适用 于 各 个 样本 的 样本 量 相 同 的 情况 .置换 检验 可 应 
用 到 样本 大 小 不 同 的 情况 ， 它 比 自助 法 检验 在 某 些 方面 有 优势 ， 但 NMCT 法 比 它 
更 容易 实施 . 类似 NMCT 法 ， 不 难 证 明 对 所 有 样本 是 iid 的 情况 ， 置 换 检验 也 
精确 有 效 ， 

把 所 有 标准 化 数据 


£-12(x ~ pO) G =1, ,ms; i=1, k), (10.3.9) 


放 在 一 起 变 成 样本 为 N 的 数据 集 ， 然 后 随机 分 成 样本 ， 且 第 i 个 样本 的 样本 量 
X mi 用 ZO G =1,… ,mi) 表示 第 i 个 样本 . 记 








Pom 4 D ZOZO, (10.3.10) 
I 
2D max { [TEND — P EnaA} 
LMp = a ， (10.3.11) 
vp Emre { ad Geach =e 


类 似 NMCT 法 , 在 均值 已 知 的 情况 下 , 置换 检验 精确 有 效 . 事实 上 , 在 原 假设 
下 ,置换 检验 得 到 的 统计 其 和 统计 基本 身 同 分 布 ， 类 似 于 对 NMCT 法 精确 有 效 的 
分 析 ， 和 置换 检验 精确 有 效 ， 然而， NMCT 法 应 用 范围 受到 限制 ， 在 模拟 分 析 中 ， 
如 果 均 值 未 知 ， 置 换 检验 在 原 假设 下 的 功效 比 由 自助 法 得 到 的 功效 更 接近 给 定 水 
平 ， 接 下 来 的 定理 说 明 在 一 般 情 况 下 置换 检验 渐 近 有 效 . 

定理 10.3.3 ”在 引 理 10.2.1 的 假定 条 件 下 ,给 定 观测 数据 , 条 件 统计 量 LMp(LAp) 
的 收敛 到 LM (LA) 的 渐 近 分 布 . 

由 置换 方法 估计 检验 LM 的 p 值 步骤 为 : 根据 > 组 独立 随机 置换 得 到 的 参考 
数据 ， 相 应 的 由 式 (10.3.11) 得 到 > MA LM8),… , MD ， 由 观测 数据 得 到 的 
LM it LMP. p 值 的 估计 等 于 LMP, IMD... LMP 值 大 于 或 等 于 LMP 
值 的 比例 . 


10.3.4 ”模拟 分 析 


本 节 通 过 模拟 三 种 类 型 的 多 元 分 布 ， 即 多 元 正 态 分 布 N(0, 14) ， 多 元 t 分布 
MT(5;0, 14) ， 以 及 各 个 分 量 以 0.9 的 概率 为 N(0,1) 分 布 ， 0.1 的 概率 为 xz) 分 
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布 的 ， 独 立 的 污染 正 态 分 布 NC2(0, 1a). 大 的 值 为 &= 2 和 大 = 6 ， 随 机 向 基 维 数 
d=2 和 d= 5， 给 定 水 平 a = 0.05. 通过 1000 组 模拟 数据 得 到 拒绝 原 假设 Ho 的 
概率 ， 对 每 组 数据 ， 重 复 抽样 > = 500 次 估计 检验 在 原 假设 下 的 临界 值 .正如 所 期 
望 得 到 的 ， 均 值 已 知 时 由 NMCT 法 得 到 的 模拟 结果 较 好 ， 这 里 只 给 出 均值 未 知 时 
的 模拟 结果 . 在 原 假设 下 ， 从 表 10.1 中 看 ， 在 大 部 分 情况 下 ,根据 置换 法 (PERM) 
得 到 的 拒绝 原 假设 的 概率 比 由 传统 自助 法 (BOOT) 得 到 的 结果 更 接近 给 定 水 平 . 
由 NMCT 法 和 自助 法 得 到 的 结果 差不多 ， 对 不 同 的 样本 量 NMCT 法 不 再 适用 ， 
模拟 结果 见 表 10.2. 从 表 中 看 ， 由 PERM 得 到 的 模拟 结果 比 BOOT 得 到 的 结果 好 
的 情况 多 ， 比 较 LA 和 LM ， 在 两 样本 的 情况 LA 的 结果 在 大 部 分 情况 下 比 LM 
的 结果 差 ; 上 = 6 时 LA 的 结果 比 LM 的 结果 好 , 无论 k=2 还 是 k=6，LA 的 
结果 在 大 部 分 情况 下 较 好 . 








表 10.1 ”在 原 假设 Ho 下 被 拒绝 的 经 验 概率 
N(0. 14) MT(5;0. Ia) NC2(0, la) 
NMCT BOOT PERM NMCT BOOT PERM NMCT BOOT PERM 
k=2m1 = mz = 20 
LM 0.053 0.045 0.048 0.053 0.046 0.054 0.055 0.046 0.056 





















































aag LA 0.059 0.057 0.054 0.062 0.046 0.057 0.063 0.060 0.061 
LM 0.055 0.045 0.056 0.050 0.044 0.051 0.057 0.039 0.053 
ic LA 0.054 0.047 0.054 0.059 0.031 0.060 0.063 0.041 0.059 
k=6, mj =20,i=1,---,6 
LM 0.033 0.062 0.060 0.032 0.064 0.059 0.033 0.061 0.058 
gaz LA 0.053 0.058 0.057 0.060 0.060 0.056 0.057 0.060 0.055 
LM 0.040 0.063 0.059 0.043 0.058 0.056 0.043 0.057 0.063 
Ha LA 0.056 0.060 0.054 0.049 0.045 0.053 0.055 0.054 0.055 
表 10.2 在 原 假设 Ho 下 被 拒绝 的 经 验 概率 
N(0, Ia) MT(5;0. Ia) NC2(0, Ia) 
BOOT PERM BOOT PERM BOOT PERM 
k= 2, m = 20, mz = 40 
LM 0.042 0.041 0.046 0.045 0.058 0.055 
g= LA 0.054 0.053 0.058 0.056 0.054 0.053 
LM 0.047 0.049 0.053 0.055 0.064 0.060 
pak LA 0.055 0.052 0.049 0.048 0.053 0.053 
k = 6,mı = m2 = 20, m3 = m4 = 30, ms = me = 40 
: LM 0.060 0.057 0.045, 0.043 0.054 0.052 
ae LA 0.056 0.055 0.041 0.045 0.055 0.054 
dese LM 0.066 0.062 0.065 0.063 0.064 0.059 


LA 0.060 0.057 0.043 0.045 0.045 0.055 
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由 自助 法 得 到 的 模拟 结果 也 可 以 比较 统计 量 LM, LA 以 及 Bartlett 统计 量 的 
功效 . Zhang 和 Boos (1992, p428) 指出 ， 随 着 维 数 d 的 增加 ， 由 自助 法 过 程 得 到 
的 Bartlett 同方 差 检 验 的 功效 越 来 越 差 . 然而 ,对 本 章 提出 的 检验 由 自助 法 步 又 得 
到 的 模拟 结果 很 稳定 ， 见 表 10.1. 在 mi =m = 20, a = 0.05 和 d=2 的 情况 ， 本 
章 所 提出 的 检验 拒绝 原 假设 的 概率 分 别 为 0.045, 0.046 和 0.046, 他 们 的 结果 分 别 为 . 
0.046, 0.045 和 0.50. 在 维 数 d = 5 时 ， 本 章 得 到 的 结果 为 0.045, 0.044 和 0.039 , 

对 应 他 们 的 结果 分 别 为 0.012, 0.023 和 0.019. 

对 检验 的 功效 研究 ， 考 虑 大 = 2 ， m = m2 = 20 以 及 d = 2 的 情况 ， 用 多 元 
正 态 分 布 Nu X) 和 多 元 上 分 布 MT(5,0, 5) 产生 数据 ， 对 矩阵 卫 ， 分 别 选择 单位 
HRE Io 和 Co, M Vo WA, Hep, 








模拟 结果 见 表 10.3. 为 了 与 Zhang 和 Boos(1992) 的 Bartlett 检验 做 比较 ， 表 中 也 
给 出 调整 的 功效 . 含有 (a p) 的 行 是 通过 原 假设 Ho F, K 10.1 中 经 验 分 布 的 95 
分 位 数 为 临界 值得 到 的 经 验 功 效 ， 从 表 中 10.3 看 ， 在 正 态 分 布 的 情况 ， 自 助 法 的 
功效 较 高 ， 但 在 多 元 t 分 布 的 情况 ， 自 助 法 的 功效 没有 置换 检验 和 NMCT 方法 得 
到 的 功效 好 ， 而 且 LA 在 大 部 分 情况 下 的 模拟 结果 比 LM 的 结果 好 .在 三 样本 的 
情况 ， 这 个 结论 同样 成 立 ， 为 了 节省 空间 ， 这 里 就 不 再 给 出 模拟 结果 . 


表 10.3 d = 2,k = 2,m, = mz = 20 时 检验 的 经 验 功效 




















N(0, C2) & N(0, 12) N(0, V2) & N(0, I2) 
NMCT BOOT PERM NMCT BOOT PERM 
LM 0.193 0.227 0.193 0.753 0.781 0.762 
LM(a—p) 0.229 0.246 0.223 0.815 0.825 0.817 
LA 0.256 0.276 0.265 0.784 0.770 0.770 
LA(a — p) 0.296 0.299 0.297 0.817 0.818 0.814 
MT(5;0, C2) & MT(5;0, I2) MT(5;0, V2) & Mt(5;0, T2) 

NMCT BOOT PERM NMCT BOOT PERM 

LM 0.228 0.231 0.233 0.553 0.521 0.561 
LM(a — p) 0.261 0.262 0.265 0.636 0.604 0.823 
LA 0.230 0.229 0.234 0.570 0.538 0.589 
LA(a — p) 0.274 0.270 0.275 0.640 0.617 0.637 





本 节 由 自助 法 得 到 的 功效 比 Zhang 和 Boos (1992) 的 模拟 结果 好 . Zhang 
和 Boos (1992) 通过 模拟 研究 在 Co 和 Vo 情况 ， 自 助 法 的 Bartlett 检验 功效 ， 
相应 的 结果 见 Zhang 和 Boos (1992) 的 表 2 中 . 为 了 比较 上 的 方便 ， 把 他 们 的 结 
果 (a = 0.05,k = 2,d = 2,ma = m = 20) 抄写 在 本 节 表 10.4 中 ， 第 一 列表 示 
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N(0, V2) 和 N(0, 五 ) 的 情况 ， 第 二 列 MT(5,0, V2) 和 MT(5,0, I2), 第 三 列 N(0, C2) 
和 N(0, 2), 第 四 列 MT(5,0,C2) 和 MT(5, 0, I2). 括号 里 的 值 是 总 体 均 值 未 知 时 得 
到 的 调整 功效 . 


表 10.4 Zhang 和 Boos(1992) 表 2 的 结果 








Bartlett B 0.642(0.657) (0.487(0.525) 0.233(0.243) 0.155(0.177) 
BOOT of 式 (10.2.6) 0.770(0.818) 0.538(0.617) 0.276(0.299) 0.229(0.270) 
NMCT of R (10.2.6) 0.784(0.817) 0.570(0.640) 0.256(0.296) 0.230(0.274) 
PERM of 式 (10.2.6) 0.770(0.814) 0.589(0.637) 0.265(0.297) 0.234(0.275) 


总 的 来 说 ,可 得 出 如 下 的 结论 ，@ 由 平均 值 构造 的 检验 LA 比 由 最 大 值 构造 的 
检验 LM 的 功效 好 ，@ 式 (10.2.5) 和 (10.2.6) 的 检验 比 Bartlett 检验 结果 好 ，@ 如 
果 不 同 样本 的 样本 其 相同 ，NMCT 法 较 容易 实施 ， 虽 然 在 某 些 情况 它 的 功效 稍微 
差 一 些 ，@ 如 果 不 同样 本 的 样本 基 不 等 ， 用 置换 步骤 的 检验 是 不 错 的 选择 . 


10.4 定理 的 证 明 


为 了 记号 上 的 方便 , 在 两 样本 的 情况 , 用 m 和 半分 别 表示 m 和 m2 ，(Yi,…， 
Yn) 表示 第 二 个 样本 ， 此 时 N= m+n. 显然 ， 根 据 随机 矩阵 的 收敛 性 可 得 统计 二 
的 收敛 性 , 所 以 只 需 考 虞 随机 和 矩阵 的 收敛 性 . 在 k- 样本 的 情况 , 根据 所 有 数据 得 到 
的 协 方差 矩阵 估计 依依 概率 收敛 到 常数 矩阵 ， 它 并 不 影响 统计 其 的 极限 ， 因 此 ， 
在 研究 检验 的 极限 性 质 时 ， 简 单 的 把 它 认为 单位 矩阵 . 

引 理 10.2.1 的 证 明 比较 简单 . 根据 Giné 和 Zinn (1990) 的 定理 2.4 ,直接 可 得 
定理 10.3.1 ， 具 体 细节 不 再 累 述 . 

证 明定 理 10.3.2 首先 证 明 {Vmimi/NWii,1 <i << k} 的 渐 近 正 态 性 ， 只 
需 证 明 Vimimi]NWii 的 所 有 线性 组 合 渐 近 正 态 ， 也 就 是 ， 对 任何 一 个 非 零 的 常数 
序列 ba, Di cictcn biVmimi/NWii 在 引 理 10.2.1 的 意义 下 渐 近 正 态 ， 通 过 一 些 
计算 不 难 证 明 ， 细 节 部 分 不 再 累 述 .证 毕 . 

证 明定 理 10.3.3 首先 证 明 在 两 样本 情况 下 置换 经 验 的 收敛 性 .用 m 表示 
ma , 且 第 二 个 样本 记 为 {7 ，… Ya}, N= mtn. Fn 和 8 分别 表示 {X1,… ,Xm} 
和 {和 Z1,… ,Zm} 的 经 验 分 布 , Gn 和 GP 分 别 表示 {Yi,… , Ya} MI {Zm Zmen} 
的 经 验 分 布 . 记 H(t) = (m/N)Fn(t)+(n/N)Gr(t), H(t) =AF(t)+(1-A)G(t). 
根据 Præstgaard (1995, 309 页 ) 的 定理 1 ， 对 几乎 所 有 序列 {Xi} 和 {Yi}, 


{Vam/N(PE(t) — GR(t)) :te R} = {VmN/n(FR (t) — Hy(t)) : t € RY 
=> RVy =: {RVE(t) :t € RY, (10.4.1) 
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其 中 ，“ 一 ”表示 在 ISF) 上 依 分 布 收敛 ， RVE 为 已 Brownian 桥 ， 1°°(F) 
由 定义 在 F 上 的 有 界 ， 实 值 函数 组 成 的 空间 ， 半 平面 {a7 <t} 上 的 示 性 函数 族 
也 属于 这 个 空间 .在 通常 情况 下 (Giné, Zinn, 1984) ， 考 虑 这 个 空间 上 的 上 确 界 范 
数 ，RYF 的 所 有 样本 轨道 包含 在 函数 族 CF, H) H, C(F, H) 表示 在 L?(H) 半 范 
@(f,9) = En(f - 9) — (En(f 一 9))? 下 的 所 有 有 界 ,一 致 连续 函数 . 由 于 CF, H) 
可 分 (Pollard, 1984, p169), 例 7) ， 而 且 C(F, H) 中 的 任何 点 完全 正则 化 (Pollard, 
1984, p67). 根据 表现 定理 (Pollard, 1984, p71) ， 在 一 致 范 数 下 ， 可 得 


{V/mN/n( FP (t) — Hy(t)):t € R'} — {RVa(t) :teE RY} as. (10.4.2) 


接 下 来 证 明 Ymn/N{(Ep? — EP) 的 收敛 性 ， 考 虑 矩阵 对 角 线 的 左上 角 元 素 ， 
Vaan] {/m SFY — 1/m $>( ZE m)l} ETERA 


Vanni fe - 0?)d (FEG) ~ GP(t) j= fe - o?)d {\/mN/n( FP (t) — Hy(t))}. 


注意 到 式 (10.4.2) ， 上 式 收 敛 到 T2 := f(t? — 0?)d RVy(t) a.s.. 接 下 来 只 需 验证 它 
的 方差 等 于 W 左上 角 元 素 的 方差 Ele? - 07). 注意 到 在 定理 10.3.3 的 条 件 下 ， 
H=F. 通过 一 些 初等 计算 ， 有 


EUTPP) = (Eo oa RV A RVa (ta) 
= / (È - o?) E(d RV (t¢))?) 
= fe 一 o2)2d F(t) = Ble? — 0?)?. (10.4.3) 


上 式 第 三 个 等 式 根据 / (#2 一 o?)?(d F())? = 0 得 到 . 

在 一 般 的 情况 , 首先 给 出 一 个 引 理 . 考虑 3 样本 的 情况 , 如 果 样 本 更 多 时 , 可 类 
似 的 通过 更 复杂 的 计算 得 到 . 所 得 到 的 所 有 数据 为 {XY,… xO, xP,... x2, 
XP, XR MZP, ZR, ZP, , Z, ZO, , 29) 表示 置换 得 到 的 
数据 . 记 N = mitm2+ms. 对 1 =1,2,3, Fm, MBP, 分 别 表示 基于 {XP ,XX 从} 
MAZO, , ZO) 的 经 验 分 布 . 记 Hn- (t) = (m2/(N — my) Fing (t) + (ms/(N = 
ma)) Fms (t). 

引 理 10.4.1 在 定理 10.3.3 的 假定 条 件 下 , 给 定 {2 ，… ,ZH)} ,条 件 经 验 过 
4 {Vm2(N - m) /ms(FR,(t) 一 HN-_m(t)) : t € R!} 弱 收 敛 到 {RVF(t) : t € Ri}, 
其 中 下 为 随机 变量 X 的 分 布 . 

证 明 A {ZP Z}, 过程 {Vma(N 一 mi)Jms (FP, (t) — Hm, (t)) : 
te R!} 几乎 等 于 式 (10.4.2) 的 左边 . 类 似 Praestgaard (1995) 定理 1 的 证 明 ， 可 得 
引 理 结论 ， 细 节省 略 . 
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接 下 来 考虑 定理 的 证 明 , 首先 考虑 (EP DP), 1 < i <1 < 3} 的 渐 近 正 态 性 ， 
即 对 任意 非 零 常数 序列 ba, Dy cictes biy/marm/N (EY — SO) 在 引 理 10.2.1 的 意 
义 下 渐 近 正 态 . 在 3- 样本 情况 , 先 研究 经 验 置换 过 程 Di cicis ba mami NFP, — 
FE) 的 收敛 性 ， 根 据 它 的 收敛 性 质 ， 可 得 (DO 一 EO), 1 < i < 1 < 3} 的 收敛 
性 . 根据 RR, = (NFw -m FR, —m2FP,)/ms, 可 证 


DS buna ]N En, FR) = Vita (biz Vina/N + bis(1 + mı /ms) Ving 
1<icl<3 
+b2a/mima](maN)) (FR, — Fw) 
+ Vitia( — biz V/m /N + boall + ma/ms) Vma /N 
+bia/mima/(msN)) (FP, — Fy) 


= Vmibn (Ek, — Fy)+ Vmabn2( Fh, — Fy) (10.4.4) 





其 中 ， bm 和 Ono 收敛 到 常数 .注意 到 Fv =m /N(FR, -FẸ m) + FR my» 可 得 


Vmibn (Fh, — Fv) + Vmabn2( FE, — Fy) 
= Vimi(bn + bn2 Vama/N)(Fh, — Fy) + Vmabna(FR, — FR_m,). 
(10.4.5) 
又 因为 (Fa — Fv) 和 (FR, — FR m) 条 件 独立 ,根据 两 样本 的 证 明和 引 理 ， 置 换 
过 程 弱 收敛 到 Gaussian 过 程 ， 接 下 来 验证 DT cicrcs bi Vim /N (Fmi — Fm1) 极 


限 的 协 方差 等 于 Diciccs bum] N (FR: — Fha) 的 极限 协 方差 ， 简单 推导 可 
得 


>, buy mim/N(Fm, — Fm) 


lg&i<lg3 
= Vii (bri + bv2/mime/N)(Fm, — Fy) + Vmabn2( Fns — FN-m,). 
(10.4.6) 
接 下 来 证 明 下 述 充分 条 件 成 立 : 


(1) Vim N/(N = ma) (Fin, — Fn) 和 ima (N= m1) ma (FP, -Fẹ m) 的 极限 
协 方差 结构 分 别 和 


vmiN/(N —mi)(Fm, — Fn) 和 ym (N = m1)/m3(Fing — Fw_m) 


的 极限 协 方差 结构 相同 ; 
(2) Fm, 一 Fv 和 Fm, — Fwy-_m 不 相关 . 


10.4 定理 的 证 明 1s 





对 (1), 由 于 Fm — Fw = (N — m )/N(Fm — FN-m) 不 难得 到 在 (t,t1)， 
Vm N/(N 一 m)(Fm, — Fn) 的 协 方差 是 


Rh) = mal Nar) ( +g) Etah) - FOF) 


= F(t Ati) — F(t)F(t1), (10.4.7) 





也 就 是 P-Brownian 桥 的 协 方差 结构 ,这 里 “A” 表 示 取 最 小 . 类 似 可 得 


vm (N 一 mi)/msa (Fm, -Fw-m) 的 协 方差 结构 . 
对 (2), 通过 一 些 初等 计算 ， 根 据 独立 同 分 布 随机 变量 具有 相同 分 布 F, 





E( Fm, (t) — Fy (t)) (Fina (t1) — FN—m (t1)) 


= -TF B(Fy-m (t) — F()(Fna(ts) — Fins (ti) 


= = ee (FA ti) — FQ)F(t)) — (Flt Ati) - FF (t))] = 0. 


证 毕 . 
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在 金融 和 保险 中 ， copula 函数 是 一 种 构造 多 元 相关 分 布 函 数 的 有 力 工具 ， 然 
而 ， 怎 样 选择 一 个 适当 的 copula 函数 用 于 拟 合 数据 ， 并 没有 找到 统一 的 方法 . 错 
误 的 建 模 会 导致 较 大 的 预测 偏差 和 错误 的 推断 ， 因 此 ， 基 于 copula 函数 的 经 验 分 
布 ， 本 章 提出 了 一 种 用 于 检验 具有 某 种 特定 参数 结构 的 copula 函数 拟 合 数据 优良 
性 的 方法 ， 由 于 该 检验 统计 其 的 极限 分 布依 赖 未 知 参数 ， 我 们 采用 NMCT 方法 确 
定 临 界 值 ， 最 后 用 一 个 简单 的 模拟 来 验证 本 章 提出 的 检验 方法 的 功效 . 


11.1 引 言 


copula 函数 ， 它 是 一 种 把 联合 分 布 和 边际 分 布 连接 起 来 的 方法 或 函数 , 并且 涵 
盖 了 边际 分 布 间 的 所 有 相关 关系 . 在 这 种 意义 上 , 使 用 copula 函数 可 以 避免 维 数 祸 
根 问题 ,而且 , 它们 可 以 用 来 拟 合 那些 用 于 资产 建 模 和 例外 事件 研究 中 的 非 高 斯 多 
TESA. 因此 ,关于 这 种 函数 的 研究 在 金融 和 保险 中 备 受 关注 ， 可 参考 文献 Bouy6 
et al.(2002), Denuit et al.(2006),Embrechts,McNeil 和 Straumann(2002), 以 及 Frees 
和 Valdezk(1998). 著名 Sklar 定理 告诉 我 们 任 一 多 元 分 布 都 可 以 分 解 为 它 的 边际 分 
布 和 相关 结构 (copula 函数 ) 两 部 分 ， 特 别 地 如 果 边 际 分 布 函数 是 连续 的 ， 相 应 的 
copula 函数 就 是 唯一 的 , 于 是 , 此 种 函数 使 得 我 们 可 以 分 步 研究 多 元 随机 变 基 的 边 
际 分 布 及 其 相关 结构 ， 关于 Copula 函数 的 更 多 理论 和 应 用 ， 见 文献 Joe(1997) 和 
Nelsen(1999). 

关于 一 元 分 布 的 各 种 推断 已 经 有 许多 经 典 的 结果 ， 见 文献 陈 希 到 (1981) 和 何 
晓 群 (2004). 但 是 ， 除 了 多 元 正 态 分 布 和 多 元 t 分 布 之 外 ， 其 他 的 多 元 分 布 函 数 仍 
在 研究 之 中 ,而 金融 和 保险 中 的 数据 又 多 呈现 厚 尾 或 偏 态 现象 . 为 了 方便 起 见 ， 人 
们 经 常 假设 真正 的 相关 结构 属于 某 个 参数 族 ， 然 后 估计 出 未 知 参 数 确定 copula K 
数 ， 但 是 不 适当 的 假设 会 导致 错误 的 结论 ， 所 以 怎样 判断 已 选择 的 copula 函数 是 
否 恰 当 显得 尤其 关键 . 文献 中 已 经 有 许多 工作 研究 如 下 的 假设 检验 问题 : 


Ho : C(-;00) € C = {C(;0) :0 € O}, (11.1.1) 


其 中 ，C 是 依赖 未 知 参数 9 的 Copula 函数 。 Wang 和 Wells(2000) 建议 采用 一 -种 非 
参数 方法 用 于 检验 给 定 的 Archimedean copula 函数 是 否 能 够 很 好 的 拟 合 二 维 的 删 
失 数 据 ，Genest ，Quessy 和 Rémillard(2006) 推广 了 他 们 的 结果 , 根据 经 验 Kendall's 
tau 过 程 和 它 的 参数 估计 ， 构 造 了 适用 于 任意 copula 函数 的 拟 合 检验 统计 量 ， 基 
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于 Rosenblatt(1952) 的 概率 积分 转换 的 思想 ， Breyman, Dias 和 Embrechts(2003) 
提出 了 Anderson Darling 类 型 的 检验 统计 量 Fermanian(2005) 考虑 了 两 个 不 依赖 
分 布 的 卡 方 检验 统计 量 ， 然 而 ,一 旦 维 数 很 高 时 ， 所 需要 的 多 元 密度 函数 的 核 估 计 
不 能 克服 “ 维 数 祸根 问题 "; Chen, Fan 和 Patton(2004) 也 采用 概率 积分 转换 和 局 部 
光滑 方法 构造 两 种 检验 来 拟 合 检验 时 间 序 列 间 的 相关 性 ， 为 了 选择 适当 的 半 参 数 
Copula 函数 ， Chen 和 Fan(2005) 使 用 伪 似 然 比 检验 . 

在 原 假设 为 二 维 Copula 函数 和 参数 真 值 = bo 时 ,统计 量 Th = VR( Cu(uw v)— 
C(u,v;40)) Al Sn = /7T2(w,v)dudv 渐 近 的 在 零 附 近 波动 ， 其 中 ， Cn(w,v) 是 在 本 
章 第 2 节 中 定义 的 copula 经 验 分 布 . Van der Varrt 和 Wellner(1996, p389) 证 
明了 m 弱 收 敛 于 一 高 斯 过 程 ， 在 更 一 般 的 条 件 下 ， Fermanian ， Radulovic 和 
Wegkamp(2004) 也 研究 了 此 问题 .然而 ， 当 参数 未 知 而 是 用 它 的 估计 6 取代 时 , 统 
Tt Th 和 Sn 的 收敛 性 却 是 未 知 的 ， 本 章 解决 了 此 问题 ， 并 且 构 造 了 基于 检验 统 
计 基 Sn = /72(w,v)dudv 的 拟 合 检验 . 为 了 使 得 检验 易于 执行 , 采用 NMCT NE 
检验 在 原 假设 下 的 分 布 ， 这 些 使 得 我 们 的 检验 具有 以 下 几 个 很 好 的 性 质 : 

(1) 该 检验 适用 于 任何 情形 ; 

(2) 该 检验 以 1/ Vn 速度 收敛 ， 其 中 n 是 样本 量 ; 

(3) NMCT 检验 易于 执行 ， 模 拟 计算 相对 比较 容易 . 

本 文 除了 11.1 节 的 引言 ， 将 要 在 11.2 节 重 点 介绍 理论 结果 和 检验 的 渐 近 性 
质 ， 关 于 非 参数 蒙特 卡 罗 检验 的 步 又， 将 在 11.3 节 中 给 出 ， 11.4 节 的 模拟 检验 的 
结果 用 于 验证 检验 的 功效 . 


11.2 检验 统计 量 及 其 渐 近 分 布 


为 了 研究 的 方便 ， 本 章 只 考虑 了 二 元 的 copula 函数 . 很 容易 将 结果 扩展 到 一 
般 的 情况 .假设 二 元 随机 矢 基 (X,Y) 服从 未 知 分 布 如 (z,y) ， 并 且 它 的 两 个 边际 
分 布 是 连续 的 ， 分 别 记 为 F(z) = (2,00) 和 Gy) = H(0o,y). 根据 Sklar 定理 ， 
则 存在 唯一 的 copula 函数 使 得 


H(z,y) = C(F(x), G(y)). (11.2.1) 


id F- (u) = inf {x € RIF(z) > u} Ml G-(v) = inf {y € RIG(y) > v}(0 < u,v < 1) 4} 
HU FO) and GO) HOARS, HPR 表示 实数 集 (—00, too). FER (11.2.1) 
又 可 写 为 


Clu,v) =H(F-(u),6-@)), OS wu. (11.2.2) 
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假设 (21,91), (22,92) (Cn Yn) 是 (X,Y) 的 n 个 独立 样本 ， 则 此 随机 矢量 的 经 
验 分 布 及 其 两 个 边际 分 布 的 经 验 分 布 可 分 别 记 为 Haley) = n Te svh 
Falz) = Hn(z,+00) 和 Gn(y) = Hn v) Fi, HE pila 函数 的 经 验 
分 布 就 是 Cx(uu) = Hn( Fy (u),G; ， 其 中 F(u) = inf {s € RIF,(s) > wu} 和 
Gz (v) = inf {t € RIGn(t) > v} PERPER Fala) 和 Gn(y) 的 广义 道 函数 ， 然 
TLE copula 函数 经 验 分 布 的 定义 依赖 函数 的 逆 运 算 ， 当 样本 有 限时 就 可 能 造成 
较 大 的 偏差 ， 类似 于 Deheuvels (1979) 和 Genest, Ghoudi 和 Rivest (1995) ， 我 们 
采用 如 下 定义 : 





ie 
On (ts 0) = = DO Hr) <u Gnt) (11.2.3) 
i=l 


易 见 nFn(zi) 是 观察 值 ri; 处 在 z1,… ,zn 中 的 秩 ， 同 样 地 nGn(w) 是 yi 处 在 
,Vn 中 的 秩 ， 于 是 Chl) 实际 上 是 样本 的 秩 函数 . Fermanian, Radulovic 和 
Wegkamp (2004) 证 明了 上 述 两 种 经 验 分 布 是 渐 近 相等 的 : 


sup [Cn(u,v) — Cilu, v)| < 2/n. (11.2.4) 


O<u,v<1 





为 了 建立 关于 式 (11.1.1) 的 拟 合 检验 ,我 们 考虑 检验 统计 最 S。 = S T2(u, v)dudo, 
HP Ta = VA(Cu(u,v) - C(u, 03). 直观 上 来 看 ，T, 和 Sn 度量 了 原 假设 和 真实 
相关 结构 copula 函数 之 间 的 距离 . 
在 给 出 统计 基 Th 和 Sn 的 渐 近 性 质 之 前 ， 我 们 首先 引入 一 些 符号 ， 任 一 矩阵 
AMERICA A’, unv RREK u Ml v 之 间 的 最 小 值 . 记 Uc(u,v) = Bo(u,v) 一 
C1(u, v)Bo(u, 1) — C2(u,v)Be(1,v), 其 中 Bc 是 一 布朗 桥 ， 它 的 协 方差 结构 为 


B(Belw, v) Bolu’, v')) = C(u nu, v Av) —C(u,v)C(u’,v’). 


这 里 的 Ci (u,v) 和 Co(u, v) 将 在 下 列 条 件 (A2) PAHE. 

定理 11.2.1 假设 第 11.5 小 节 的 条 件 (Al)~(A3) fA (11.1.1) RÈ, MI 
验 copula 过 程 Tn 在 lee([0,1]2?) 上 依 分 布 收敛 于 高 斯 过 程 Go = Uc 一 ay, 
其 中 V 是 二 元 的 中 心 化 的 随机 失 量 ， 其 协 方差 矩阵 为 S. N Sn 依 分 布 收敛 于 
5=/(Gc(wu,v))?dudv. 过 程 Go 的 协 方差 结构 为 
B(Go(u,v)Golu',) = E(Uclu, vUo(u, wv) + ae (u, BC) glee) w) 


-ue (vovv) - OCC! gta oy WV), 
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11.3 NMCT 
其 中 ， 
E(Voluryv) =- 人， Zeso)actetg 
[ojxlo 吕 
+C, (u,v) L(s,v;0)dC(s, v; 0) 
[0,u) x [0,2] 
+C2(u,v) Lu, t; 0)dC(u, t; 9). 
[0,1] x(0,v] 


下 面 我 们 研究 上 述 检验 对 不 同 的 备 择 检 验 的 功效 , 首先 定义 一 个 依赖 参数 9 的 
copula 函数 为 C(;6) 和 一 有 界 可 测 函 数 不 (;6) ， 其 中 后 者 满足 条 件 W(1,0;9) = 
0=W(0,1;0), W(1,u;0) = 0 = W(v, 15). 考虑 具有 如 下 形式 的 备 择 假设 

C(-) = CC; 4) + W(-;8)/n® (a > 0). (11.2.5) 


这 里 我 们 假设 n 充分 大 ,使 得 C() 和 Clu, v2) — C(uz, v1) — C(u, v2) + C(ur, 01) 
(u1 <= U2, v2 <= v) 都 是 非 负 的 ， 也 就 是 确保 CCO) 仍 是 copula BRK. FRA 
理 结论 表明 ， 当 a = 0 时 ， 对 所 有 的 备 择 假设 ， 检 验 都 是 相合 的 ; 当 0 < a < 1/2 
时 ， 检 验 以 1/V5 的 参数 速度 收敛 . 

定理 11.2.2 假设 第 11.5 小 节 的 条 件 (Al)~(A3) 成 立 ， 则 在 局 部 备 择 模型 
KX (11.2.5) 下 ， 当 0 < a < 1/2 时 ， Tr 依 分 布 收敛 于 co ; 当 a= 1/2, Tn 在 
Lee([0,1]2?) 上 依 分 布 收敛 于 高 斯 过 程 Got+W, 相应 地 ， Sn SILA [(Go(u,v) + 
W (u, v; 0))?°dudv. 

由 上 述 结论 ， 易 见 根据 copula 函数 的 经 验 分 布 和 其 对 应 的 参数 估计 之 间 的 距 
离 得 到 的 统计 其 , 在 原 假设 Ho 下 , 它们 非常 的 接近 . 因此 , 如果 检 验 统计 量 5, 的 
值 大 于 其 分 布 的 (1 - a)% 的 分 位 数 时 ， 就 应 当 拒 绝 原 假设 ， 反 之 ， 接 受 原 假设 . 
然而 , 定理 11.2.1 表明 极限 分 布依 赖 于 未 知 参数 且 协 方差 结构 非常 复杂 ,为 了 使 我 
们 的 检验 易于 执行 ， 接 下 来 采用 NMCT 模拟 检验 的 临界 值 . 





11.3 NMCT 


在 这 一 节 , 我 们 借助 模拟 检验 统计 量 Sn 在 原 假设 下 服从 的 分 布 .使 用 Rademacher 
随机 变量 生成 权 构造 条 件 NMCT 统计 其 . 

Rademacher 随机 变量 是 以 等 概率 取 值 为 +1 的 . 记 a1,e2,… ,en 是 iid. 的 
Rademacher 变量 , 并且 与 样本 (z1, y1), (22,92), , (Zn,yn) 独立 .根据 定理 11.2.1 的 
证 明 ， 对 应 于 统计 其 Th 的 NMCT 统计 量 定义 为 





1 
Tn (Ens sv) = i Da (CS — Cn(u, »)) 
i=1 
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~Cin(ts2) Se (Imou - u) 
1 


n 
—C2n(u, 去 De (lenrs = v) 
i=l 





C(u,v) 1 È y 
-Ai Fay ern), (0 < wv <1), 


其 中 ，en=(e1,e2,… ,en)T, Cin 和 Con 分 别 是 C 和 Co 的 相合 估计 回顾 copula 
函数 的 定义 式 (11.2.2), 很 容易 得 到 
Ci(u,v) = ËH- (WE) /S(E-()) 


Caluso) = ÈH- (0), G70) G) 
则 我 们 采用 如 下 的 非 参数 方法 分 别 得 到 C(u,v) 和 Calu, v) 的 售 计 Cin 和 Can : 


Cin(u,v) = EEr (u), Ga (v))/ fn(Fr (v)) 


Conlw) = È Ha (Fe (u), Gy (0))/4n(G (W). 


这 里 的 Hal), Sal) 以 及 gnl) 分 别 是 联合 分 布 HO) 和 边际 密度 函数 f(-) 和 g(-) 的 
核 估计 ， pee Fermanian 和 Scaillet(2003). 相应 的 条 件 NMCT 统计 量 为 





Salen) = J T? (En, u, v)dudv. 


检验 的 步 又 如 下 ， 

步骤 1 用 一 相合 估计 的 方法 估计 参数 9. 

步骤 2 生成 m 个 Rademacher an 记 为 = (E, L, = 
$2 m. 然后 计算 Sn (e), ),4=1,2,-- 

“$m 计算 检验 的 p 值 : 


p=k/(m+1), 


HF, k= #{5,(eM) > 59,i=0,1,--- ,m}(SO = Sa). 
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11.4 模拟 分 析 


为 了 分 析 检验 的 功效 , 我 们 针对 不 同 的 原 假设 和 备 择 假设 进行 了 模拟 研究 . 参 
考 文献 Fermanian(2005), 我 们 选用 如 下 的 copula 函数 来 产生 样本 数据 : 


l-a (exp~®" —1)(exp~®" —1) 
= = Al 
Calu, v, 0) = auv 7 In ( 十 EE ‘ (11.4.1) 





HP, 040A ae (0,1). 易 见 上 述 copula 函数 是 二 维 独立 的 copula 和 二 维 
Frank’s copula 的 线性 组 合 ， 本 节 模 拟 的 原 假设 是 独立 的 copula (a = 0) ， 两 个 边 
际 分 布 分 别 假设 是 标准 正 态 的 . 关于 样本 数据 的 生成 ， 可 参考 文献 Nelsen(1999) 或 
Fermanian(2005). 本 文采 用 半 参 数 极 大 似 然 估计 方法 估计 参数 6, 并且 满足 第 11.5 
节 中 的 假设 条 件 (A3). 在 估计 Ci 和 Co 时 ， 采 用 了 高 斯 乘积 核 和 拇指 准则 (Wang 
和 Wells(2000)) 确定 估计 的 窗 宽 . 在 确定 临界 值 时 ， 用 于 近似 检验 的 p 值 的 重复 次 
数 m 取 为 1000 ， 显 著 性 水 平 是 5% ， 样 本 值 = 100. 于 是 ， 根 据 第 11.3 节 介绍 
的 模拟 步 又 ， 计 算 检验 统计 基 的 观测 值 S。 和 条 件 NMCT 统计 其 的 值 Su(en). 

表 11.1 中 给 出 了 统计 基 Sn 的 检验 功效 ， 为 了 便于 和 Fermanian(2005) 的 检验 
统计 其 ， 记 它们 分 别 是 S 和 了， 做 简单 比较 , 表 11.1 也 给 出 他 们 的 功效 ， 根 据 此 
表 ， 我 们 可 以 得 到 如 下 结论 : 

(1) 在 a=0， 即 在 原 假设 成 立时 ， 三 种 检验 的 功效 都 接近 显著 水 平 ， 

(2) 随 着 参数 9 的 增加 , 三 种 检验 的 功效 变 得 越 来 越 大 , EE 9= 25 Mla = 0.5 
检验 的 功效 达到 最 大 ; 

(3) 随 着 参数 a 的 增加 ,三 种 检验 的 功效 也 在 增加 ; 但 是 当 a 的 值 接近 1 时 ， 
检验 的 功效 又 快速 下 降 ; 

(4) 当 X AY 的 相关 程度 较 小 ， 即 当 9 非常 小 或 者 a 比较 大 时 ， 我 们 的 检验 
的 功效 要 优 于 S 和 了 ; RZ, 4X MY 高 度 相关 时 ，T 的 表现 最 好 ， SKZ. 

事实 上 , 参数 9 的 大 小 度 基 了 随机 变量 X 和 Y 的 相关 程度 的 强 弱 ， 而 随 着 a 
的 增加 ， 混 合 copula 函数 (11.4.1) 也 就 趋向 于 原 假设 一 一 独立 copula 函数 uv. 既 
然 独 立 copula 函数 正 是 Frank's copula 函数 族 的 边界 , 正如 Fermanian (2005) 提 到 
的 , 参数 估计 Ô 可 能 不 满足 第 11.5 节 的 条 件 (A3), 使 得 检验 的 效果 变 得 反常 而 不 容 
易 解 释 . 但 是 ， Sn 检验 功效 要 高 于 S 和 了 说 明了 前 者 比较 稳健 当 X 和 了 的 相 
关 程 度 较 强 时 ， 局 部 光滑 的 方法 更 容易 捕捉 到 分 布 的 波动 ,使 得 Fermanian(2005) 
的 检验 的 功效 高 ;反之 ， 当 copula 函数 较为 平缓 ， 即 相关 程度 较 弱 时 ， 经 验 过 程 
方法 对 所 有 观测 值 点 皆 给 予 相 同 的 概率 而 显得 更 加 敏感 . 特别 地 , 当 备 择 模型 很 接 
近 原 假设 时 (a = 0.1, 而 9 比较 小 时 ) ， Sn 的 表现 比较 好 ， 这 说 明 我 们 的 检验 对 局 
部 备 择 更 加 敏感 综 上 所 述 ,模拟 结果 和 理论 是 相符 合 的 , 也 说 明了 我 们 的 检验 无 
论 在 原 假设 还 是 在 备 择 假设 下 ， 都 有 较 好 的 模拟 结果 . 
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表 11.1 当 样 本 值 n = 100 和 显著 水 平 为 5% 时 ， 检 验 统计 量 Sn, SUR 了 的 检验 功效 








混合 参数 模型 参数 拒绝 率 拒绝 率 拒绝 率 
a 0 Sn S T 
0 5 0.02 0.00 0.02 

10 0.00 0.00 0.00 
15 0.00 0.00 0.01 
20 0.00 0.00 0.01 
25 0.04 0.00 0.08 
0.1 5 0.04 0.00 0.00 
10 0.05 0.00 0.00 
15 0.07 0.00 0.07 
20 0.23 0.00 0.22 
25 0.38 0.00 0.60 
0.2 5 0.05 0.01 0.01 
10 0.10 0.01 0.05 
15 0.30 0.03 0.36 
20 0.50 0.17 0.80 
25 0.66 0.31 0.95 
0.3 5 0.10 0.03 0.03 
10 0.25 0.13 0.21 
15 0.57 0.18 0.67 
20 0.80 0.57 0.95 
25 0.91 0.84 1.00 
0.5 5 0.11 0.07 0.12 
10 0.34 0.19 0.33 
15 0.63 0.58 0.71 
20 0.84 0.89 0.98 
25 0.96 0.95 1.00 
0.9 5 0.11 0.02 0.01 
10 0.13 0.03 0.00 
15 0.14 0.06 0.00 
20 0.16 0.02 0.02 
25 0.13 0.37 0.03 








11.5 定理 的 证 明 


为 了 证 明定 理 ， 给 出 如 下 条 件 : 

KAD 边际 密度 函数 f(-) 和 g(-) 在 其 定义 域内 可 微 ， 并 且 是 非 负 的 . 

{(A2)] copula 函数 C(u, v; 0) 的 偏 导 函 数 连续 ,分 别 记 为 Ci(w,v) = (OC(u, v; 6))/(% 
和 Co(u,v) = (C(u, v;6))/(Ov) ， 并且 其 密度 函数 clu, v; 0) 关于 参数 9 是 可 微 的 . 
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((A3)] 0 e RO 的 估计 6 满足 条 件 
ô-0= PE LEDC) + op(1), 
EP, MEX), GY) 0) 是 一 个 4 维 的 零 均值 的 随机 矢量 ， 其 协 方差 结构 为 
Z = E(L(F(X),G(Y);0)E"(F(X), G(Y);0)). 


事实 上 , 条 件 (AL) 和 (A2) 是 为 了 确保 检验 的 相合 性 . 而 条 件 (A3) 对 于 许多 估计 都 
是 成 立 的 , 如 最 小 二 乘 估计 或 者 极 大 似 然 估计 等 . 特别 地 ， Fermanian (2005) 证 明 非 
参数 极 大 似 然 估计 满足 条 件 (A3) : 6-0 = 14(9)-! © (mn c(F (xi), G(x); ))/(80)+ 
op ((In(Inn))/m), $t}, 4(9) =- lim 1 E((Q, (0 ))/(80807) ) 是 一 个 qxg 的 对 
PME, Mi Qn(9) = + k È ne( fates Gn(2:);0). 
证 明定 理 11.2.1 为 了 证 明定 理 11.2.1 ， 我 们 只 需要 用 iid 的 随机 变量 和 近 
似 统计 基 T, 即 可 ， 注 意 到 
Th = Va(Ca(u, v) — C(u,v; ô) 

= -va 人 c (u,v; 6) — Clu, v)) + Va(Cn(u, v) — C(u, »)) 

= -j+ Jo, 
其 中 ，C(w,v) 表示 真正 的 相关 结构 copula 函数 . 根据 泰勒 展开 和 定理 11.2.1 中 的 
条 件 ， 可 以 得 到 


1 OC(wv;0) 


AE oer 


Èr Xi), GY;:); 8) + op(1 ). (11.5.1) 


下 面 我 们 将 要 考虑 Jo. 回顾 copula 函数 的 定义 (11.2.2) 及 其 经 验 估 计 (11.2.3), 我 
们 有 


Pa v) — C(u, »)) 
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-H(F-(u),G=()))] + a 二 (rreossceoso -Clud)) 
+VvR(ECEr(o,Gz) ~ H(F-(u),G-(v)) 
=V Vt V 
FAA Vn(Hn(-)— HO) 是 随机 等 度 连续 的 ， 并 且 (11.2.4) 成 立 ， 所 以 
Vi = 0,(1). (11.5.2) 


由 于 Ve 已 经 是 中 心 化 的 iid 随机 变量 的 和 ， 我 们 现在 考虑 Vo. 经 过 一 些 初等 计 
算 ， 可 以 得 到 
Vi(H(F (w), Gi (0) - H(F~(u),G-(v))) 
= Va(o(FUFr(w),G(G5(®))) - C(u,2)) 
= VC (u v) (F (Fe (W) ~ u) + VnCa(u,v) (GG; (v)) = v) + 001) 
= VAs (wv) (u = Fn(F- (u))) + VnC2lu, v) (v = Ga(G=())) + op(1) 


= -Otu D (Ir )<u} 一 u) 
~Ca(u,v) 去 ， > (Hence) - v) + o0). (11.5.3) 


由 上 述 证 明 的 结果 式 (11.5.1) ~ (11.5.3) 以 及 文献 Rosenblatt(1952, p157) 的 定理 
VIL21 ， 定 理 11.2.1 证 毕 . 

证 明定 理 11.2.2 因为 该 定理 与 定理 11.2.1 的 证 明基 本 相同 ， 我 们 只 给 出 证 
明 的 框架 ， 根 据 备 择 模 型 (11.4.1) 以 及 上 述 证 明 ， 可 知 


Th = Va (Calu v) - C(u, v;Â) — W (u, v;ĝ)/n®) + Wu, v; 8)/n° 12 
= J3+ Js. 


易 见 Js 仍然 在 €°((0,1)?) 上 依 分 布 收敛 于 Go , m4 0< a < 1/2 R# a= 1/2 
时 Ja 分 别 收敛 于 无 穷 大 或 者 W(-). 此 定理 得 证 . 
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《现代 数学 基础 丛书 》 序 


对 于 数学 研究 与 培养 青年 数学 人 才 而 言 ， 书 籍 与 期 刊 起 着 特殊 重要 的 作用 . 许 
多 成 就 卓越 的 数学 家 在 青年 时 代 都 曾 钻研 或 参考 过 一 些 优秀 书籍 ,从 中 汲取 营养 ， 
获得 教 益 . 

20 世纪 70 年 代 后 期 , 我国 的 数学 研究 与 数学 书刊 的 出 版 由 于 文化 大 革命 的 
浩劫 已 经 破坏 与 中 断 了 十 余年 ， 而 在 这 期 间 国际 上 数学 研究 却 在 迅猛 地 发 展 
着 .1978 年 以 后 ,我 国 青年 学 子 重新 获得 了 学 习 、 钻 研 与 深造 的 机 会 . 当时 他 们 
的 参考 书籍 大 多 还 是 50 年 代 甚至 更 早期 的 著述 . 据 此 ， 科 学 出 版 社 陆续 推出 了 多 
套数 学 丛书 ， 其 中 《纯粹 数学 与 应 用 数学 专著 》 从 书 与 《现代 数学 基础 丛书 》 更 
为 突出 , 前 者 出 版 约 40 卷 , 后 者 则 逾 80 卷 . 它们 质量 其 高 , 影响 颇 大 ,对 我 国 数 
学 研究 、 交 流 与 人 才 培 养 发 挥 了 显著 效用 . 

《现代 数学 基础 丛书 》 的 宗旨 是 面向 大 学 数学 专业 的 高 年 级 学 生 、 研 究 生 以 及 
青年 学 者 ， 针 对 一 些 重要 的 数学 领域 与 研究 方向 ， 作 较 系 统 的 介绍 . 既 注 意 该 领 
域 的 基础 知识 ， 又 反映 其 新 发 展 , 力求 深入 浅 出 , 简明 扼要 ,注重 创新 . 

近年 来 , 数学 在 各 门 科学 、 高 新 技术 、 经 济 、 管 理 等 方面 取得 了 更 加 广泛 与 
深入 的 应 用 , 还 形成 了 一 些 交 叉 学 科 . 我 们 希望 这 套 从 书 的 内 容 由 基础 数学 拓展 
到 应 用 数学 、 计 算数 学 以 及 数学 交叉 学 科 的 各 个 领域 . 

这 套 从 书 得 到 了 许多 数学 家 长 期 的 大 力 支持 , 编辑 人 员 也 为 其 付出 了 艰辛 的 
劳动 . 它 获得 了 广大 读者 的 喜爱 . 我 们 诚挚 地 希望 大 家 更 加 关心 与 支持 它 的 发 展 ， 
使 它 越 办 越 好 ， 为 我 国 数学 研究 与 教育 水 平 的 进一步 提高 作出 贡献 . 





杨 乐 
2003 年 8 月 
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2005 年 斯 普 林 格 出 版 社 出 版 了 朱 力 行 的 英文 专著 Nonparametric Monte Carlo 
Tests and Their Applications, 这 本 书 是 基于 朱 力 行 和 他 的 合作 者 的 研究 成 果 ， 以 及 
他 在 华东 师范 大 学 开设 讨论 班 的 相关 资料 写成 的 ， 书 中 主要 介绍 了 一 种 新 的 统计 
检验 方法 , 即 非 参数 蒙特 卡 罗 检 验 ,并 将 这 种 方法 运用 到 各 种 半 参 数 和 非 参 数 模型 
的 检验 问题 . 

在 统计 推断 中 , 用 蒙特 卡 罗 方法 去 通 近 统计 量 的 分 布 已 成 为 非常 重要 的 研究 分 
X, 其 主要 思想 是 通过 产生 参考 数据 , 构造 新 的 分 布 去 逼近 基于 观测 数据 得 到 的 统 
计量 分 布 , 因而 ， 在 这 个 研究 领域 ， 如 何 产生 参考 数据 至 关 重 要 . 在 参数 情况 下 ， 
Barnard(1963) 首次 提出 蒙特 卡 罗 检 验 (MCT). MCT 有 一 些 很 好 的 性 质 , 非常 类 似 
于 其 后 发 展 起 来 的 参数 自助 法 (parametric bootstrap). 在 这 之 后 ， 人 们 对 MCT 法 
有 较 多 的 研究 ， 如 MCT 最 优 性 和 计算 功效 的 研究 ， 然而， 在 半 参 数 甚至 非 参 数 的 
情况 下 ， 如 何 产生 这 样 的 参考 数据 是 一 个 具有 挑战 性 的 难题 . 

非 参数 蒙特 卡 罗 检 验 (NMCT) 就 是 针对 这 个 问题 提出 的 . NMCT 的 算法 很 
容易 实施 ， 并 且 在 很 多 情况 下 ,检验 精 确 有 效 、 此 外 ， 通 近 的 精确 性 相对 比较 容易 
研究 ， 如 第 3 章 的 相关 内 容 就 做 了 这 方面 的 探讨 . 

我 们 一 直 在 考虑 写 一 个 中 文 版 ， 以 方便 中 文 读者 . 因而 ,我 们 对 这 本 专著 的 内 
容 做 了 进一步 的 充实 ， 加 进 了 第 11 章 . 许 王 莉 博 士 翻译 和 整理 了 全 部 的 内 容 ， 形 
成 中 文书 稿 的 基本 结构 . 朱 力行 在 此 基础 上 做 了 进一步 的 整理 . 我 们 也 重 写 了 中 文 
稿 的 前 言 部 分 . 

在 此 ， 我 们 要 感谢 我 们 的 主要 合作 者 ， 其 中 包括 Y. Fujikoshi, K. Naito, G. 
Neuhaus, K. W. Ng, W. Stute, K. C. Yuen; 第 8 章 是 许 王 莉 和 朱 力 行 共同 完成 的 ， 
并 且 是 许 王 莉 博士 论文 的 一 部 分 ， 第 6 章 是 许 王 痢 和 朱 若 青 一 起 完成 的 未 发 表 的 
文章 , 后 者 在 文章 中 负责 模拟 部 分 并 与 华东 师范 大 学 的 博士 生 武 萍 、 於 州 和 朱 利 平 
博士 共同 完成 第 11 章 . 2002~2003 年 ， 在 华东 师范 大 学 开设 讨论 班期 间 , 复旦 大 
学 朱 仲 义 博士 和 华东 师范 大 学 张志强 博士 对 本 书 也 给 予 了 很 好 的 建议 . 

英文 专著 Nonparametric Monte Carlo Tests and Their Applications 得 到 香港 大 
学 和 香港 研究 基金 (HKU7129/00P; HKU7181/02H HKU7060/04P) 的 部 分 资助 . 作 
为 洪 堡 研究 奖 (Humboldt Research Award) 的 获得 者 ， 朱 力行 在 访问 德国 Giessen 
大 学 和 Hamburg 大 学 期 间 ， 也 受到 德国 Alexander-von 洪 堡 基金 的 资助 ， 使 他 在 
教学 之 余 完成 斯 普 林 格 出 版 社 的 专著 ， 斯 普 林 格 出 版 社 的 编辑 John Kimmel 先生 
在 撰写 此 书 期 间 给 予 了 极 大 帮助 . 此 后 ,在 我 们 撰写 这 本 中 文稿 期 间 ， 香 港 浸 会 大 
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也 得 到 中 国人 民 大 学 的 支持 . 特别 是 科学 出 版 社 的 陈 玉 琢 女士 , 给 予 了 有 益 的 建议 
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朱 力行 
香港 浸 会 大 学 
HEF 
中 国人 民 大 学 
2007 年 3 月 


内 容 简 介 


本 书 提出 一 种 新 的 产生 参考 数据 的 方法 构造 条 件 统计 量 , 称 之 为 非 参 
数 蒙 特 卡 洛 检验 (NMCT). 全 书 共 分 11 章 : 第 1 章 介绍 蒙特 卡 罗 检 验 ; 
第 2 章 用 NMCT 方法 检验 4 种 类 型 的 分 布 ， 并 且说 明 此 方法 对 这 些 类 型 
的 检验 精确 有 效 ; 第 3 章 证 明 NMCT 方法 对 4 种 情况 是 渐 近 有 效 的 ， 而 
H pn 相合 ; 第 4-6 章 研究 了 回归 模型 的 模型 检验 问题 ， 也 说 明了 Wild 
自助 法 在 某 些 情况 下 不 相合 ;第 7-9 章 研 究 了 一 些 用 自助 逼近 法 可 以 实现 
的 问题 ， 但 是 NMCT 方法 也 很 容易 实现 ， 而 且 功 效 很 好 ; 第 10~11 章 分 
别 介绍 协 方差 矩阵 的 同方 差 检验 和 参数 型 coupula 函数 的 拟 合 检验 . 

本 书 特 别 适 合 重 抽样 逼近 领域 或 者 是 将 重 抽样 逼近 技术 应 用 到 其 他 
应 用 领域 的 研究 人 员 ， 以 及 对 拟 合 优 度 检验 方向 有 兴趣 的 学 者 . 
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